標簽:多模態大模型

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

大語言模型簡史:從Transformer(2017)到DeepSeek-R1(2025)的進化之路

原標題:大語言模型簡史:從Transformer(2017)到DeepSeek-R1(2025)的進化之路 文章來源:人工智能學家 內容字數:24587字大型語言模型(LLM)發展簡史:...
閱讀原文

統一SAM2和LLaVA!字節豆包提出Dense Video多模態大模型Sa2VA

第一個結合SAM-2和LLaVA-like的視頻多模態大模型。
閱讀原文

反超 DeepSeek-V3,新發布的 Qwen2.5-Max 到底有多牛?

登上大模型盲測榜單全球前十,數學及編程能力奪冠。
閱讀原文

年末重磅!ByteDance Research視頻理解大模型「眼鏡猴」正式發布

補齊多模態最后一塊短板,Tarsier2 反超 GPT4o、Gemini-1.5-Pro!
閱讀原文

階躍星辰再拿多模態榜首,全方位升級發布六款模型

由月更加速到日更,階躍模型迭代駛入「快車道」。
閱讀原文

前微軟亞研院視覺專家胡瀚加入騰訊,負責混元多模態大模型

胡瀚是計算機視覺領域通用架構Swim Transformer的核心作者之一。
閱讀原文

謝賽寧、李飛飛「空間智能」新作:多模態大模型仍難突破空間推理

原標題:謝賽寧、李飛飛「空間智能」新作:多模態大模型仍難突破空間推理 文章來源:人工智能學家 內容字數:8364字多模態大語言模型的空間推理能力研究 本...
閱讀原文

決策背后的秘密:探索首個多模態大模型的魔法與科學之謎

首個深入探索多模態大模型(MLLM)的可解釋性綜述,從數據、模型、訓練推理多個視角剖析多模態人工智能的決策邏輯,揭示其 “魔法” 背后的科學依據。
閱讀原文

天池 Better Synth 多模態大模型數據合成挑戰賽盛大開幕

原標題:天池 Better Synth 多模態大模型數據合成挑戰賽盛大開幕 文章來源:小夏聊AIGC 內容字數:3565字第四屆 Data-Juicer 數據挑戰賽盛大開啟 據AITOP100...
閱讀原文

顛覆性技術:將多模態大模型計算量削減至驚人的12%!

本文在 Qwen2-VL 和 InternVL2.0 上驗證了此種剪枝策略的普適性。
閱讀原文
12