標簽:文本

英偉達開源NVLM 1.0屠榜多模態!純文本性能不降反升

新智元報道編輯:LRS 【新智元導讀】NVLM 1.0系列多模態大型語言模型在視覺語言任務上達到了與GPT-4o和其他開源模型相媲美的水平,其在純文本性能甚至超過了L...
閱讀原文

僅用4塊GPU、不到3天訓練出「開源版GPT-4o」,這是國內團隊最新研究

機器之心報道 編輯:小舟、陳陳LLaMA-Omni能夠接收語音指令,同步生成文本和語音響應,響應延遲低至 226ms,低于 GPT-4o 的平均音頻響應延遲 320ms。以 ChatG...
閱讀原文

KG+LM超越傳統架構!海德堡提出全新圖語言模型GLM | ACL 2024

新智元報道編輯:alan 【新智元導讀】近日,來自海德堡大學的研究人員推出了圖語言模型 (GLM),將語言模型的語言能力和知識圖譜的結構化知識,統一到了同一種...
閱讀原文

新SOTA來了:國產9B模型多項得分超4o-mini,中國出海電商已經用上了

煢煢 發自 凹非寺量子位 | 公眾號 QbitAI阿里開源,又拿第一了。 這次是在多模態領域: 就在剛剛,阿里國際AI團隊開源多模態大模型Ovis1.6。在多模態權威綜合...
閱讀原文

一張圖實現街道級定位,端到端圖像地理定位大模型AddressCLIP登ECCV2024

AddressCLIP項目組 投稿量子位 | 公眾號 QbitAI拔草星人的好消息來啦! 中科院自動化所和阿里云一起推出了街景定位大模型,只要一張照片就能實現街道級精度的...
閱讀原文

面壁小鋼炮 3.0 重磅發布!“無限”長文本,性能超 Kimi

整理 | 褚杏娟 近日,面壁智能宣布,旗艦端側模型面壁「小剛炮」系列進化為全新 MiniCPM 3.0 基座模型,再次以小博大,以 4B 參數,帶來超越 GPT-3.5 的性能...
閱讀原文

反向和錯位圖靈測試:GPT-4比人類更「人性化」!

新智元報道編輯:lumina 【新智元導讀】加州大學的研究人員通過反向和錯位圖靈測試,探討了人類和AI在區分對話者是人類還是AI時的能力。但結果表明,在不進行...
閱讀原文

老黃預言成真!Roblox官宣AI秒生3D物體模型,引爆10億玩家游戲新世界

新智元報道編輯:桃子 喬楊 【新智元導讀】老黃預言AI生成游戲的未來,很快就要實現了!在一年一度Roblox開發者大會上,CEO官宣了3D基礎模型,僅用文本提示便...
閱讀原文

讓大模型能聽會說,國內機構開源全球首個端到端語音對話模型Mini-Omni

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

4B小模型掀翻大模型牌桌!性能超GPT-3.5,無限長文本性能超Kimi…

殺瘋了!殺瘋了! 你敢相信 4B 參數小模型,性能卻超越千億量級的 GPT-3.5 ! OpenAI、谷歌、微軟、蘋果等一眾海內外巨頭還沒做到的事,被一家中國大模型公司...
閱讀原文

智譜清言 App 全新升級視頻通話功能,并推出新一代基座大模型

整理 | 褚杏娟 近日,智譜宣布清言 App 推出“視頻通話”功能,同時官宣了新一代基座大模型 GLM-4-Plus,此外還將 CogVideoX-5B 開源、GLM-4-Flash 免費。全新...
閱讀原文

智譜攜基座大模型 GLM-4-Plus 亮相 KDD,清言 app 全新升級視頻通話功能

最新基座大模型 GLM-4-Plus發布并上線開放平臺! 在 KDD 國際數據挖掘與知識發現大會上,智譜 GLM 團隊介紹了新一代基座大模型GLM-4-Plus。GLM-4-Plus 是智譜...
閱讀原文

模型小,還高效!港大最新推薦系統EasyRec:零樣本文本推薦能力超越OpenAI、Bert

新智元報道編輯:LRST 【新智元導讀】EasyRec利用語言模型的語義理解能力和協同過濾技術,提升了在零樣本學習場景下的推薦性能。通過整合用戶和物品的文本描...
閱讀原文

騰訊版GPT-4o開源平替方案:VITA

生成式AI時代最火AI芯片峰會下月來襲!9月6-7日,智猩猩發起主辦的2024全球AI芯片峰會將在北京盛大舉行。峰會設有開幕式、數據中心AI芯片專場、邊緣/端側AI芯...
閱讀原文

RTX3090可跑,360AI團隊開源最新視頻模型FancyVideo,紅衣大叔都說好

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文
1234522