標簽:基準
一塊錢100萬token,超強MoE模型開源,性能直逼GPT-4-Turbo
機器之心報道 編輯:陳萍、小舟開源大模型領域,又迎來一位強有力的競爭者。 近日,探索通用人工智能(AGI)本質的 DeepSeek AI 公司開源了一款強大的混合專...
上海AI Lab開源首個可替代GPT-4V的多模態大模型
夕小瑤科技說 原創作者 | 任同學與開源和閉源模型相比,InternVL 1.5 在 OCR、多模態、數學和多輪對話等 18 個基準測試中的 8 個中取得了最先進的結果。 上海...
終于有人調查了小模型過擬合:三分之二都有數據污染,微軟Phi-3、Mixtral 8x22B被點名
機器之心報道 編輯:佳琪、蛋醬當前最火的大模型,竟然三分之二都存在過擬合問題? 剛剛出爐的一項研究,讓領域內的許多研究者有點意外。提高大型語言模型的...
蘋果首次公布開源大模型,加緊和OpenAI談判,我們從中找到了AI iPhone的細節
AI iPhone 怎么做?開源最近成了 AI 圈繞不開的高頻熱門詞匯。 先有 Mistral 8x22B 悶聲干大事,后有 Meta Llama 3 模型深夜炸場,現在連蘋果也要下場參加這...
首批中文版Llama3模型來了,解釋成語、答弱智吧問題
機器之心報道 編輯:小舟、張倩中文問題,中文回答。最近,Meta 推出了 Llama 3,為開源大模型樹立了新的標桿。 和以往的原始 Llama 模型一樣,Llama 3 對中...
微軟來大招:手機部署堪比GPT3.5高性能大模型!
夕小瑤科技說 原創作者 | 任同學 上周 LLaMa3 算是把關注度拉爆了,這才過了幾天,微軟已經宣布自己的 Phi-3-mini (3.8B) 模型可以媲美 Mixtral 8x7B 和 GPT-...
微軟發布Phi-3,性能超Llama-3,可手機端運行
機器之心報道 編輯:小舟、澤南數據已成為提升大模型能力的重點。Llama-3 剛發布沒多久,競爭對手就來了,而且是可以在手機上運行的小體量模型。 本周二,微...
Meta AI 挑戰 OpenAI!扎克伯格發布最強開源模型Llama 3,最大4000億參數
大數據文摘受權轉載自頭部科技 文丨Congerry Meta 最新開源模型 Llama 3 如約而至。 上周,一位Meta員工透露,兩款小型Llama 3模型將于本周發布。 今天,它來...
從文字模型到世界模型!Meta新研究讓AI Agent理解物理世界
新智元報道編輯:Mindy 【新智元導讀】Meta新發布的開放詞匯體驗問答(OpenEQA)基準,旨在衡量AI Agent對物理空間的理解能力,但目前AI Agent的水平還是無法...
馬斯克旗下xAI發布首個多模態大模型!
大數據文摘受權轉載自頭部科技 文丨Congerry 3月中旬,馬斯克旗下的 xAI 剛剛宣布開源 Grok-1 大模型! 一個月過去,xAI 又掏出了 Grok-1.5V。 Grok-1.5V是xA...
離世界模型更近一步!Meta開源OpenEQA,評估AI Agent情景理解能力
夕小瑤科技說 原創作者 | 任同學Yann LeCun 朝著 “世界模型” 又近了一步。 Meta最新的開源工作OpenEQA:從文字模型到世界模型,可以像人一樣記憶、推理的新基...
今日arXiv最熱NLP大模型論文:北京大學&快手發布統一的圖文視頻生成大模型Video-LaVIT
夕小瑤科技說 原創作者 | 芒果引言:探索視頻與語言模型的新融合隨著多模態大語言模型(LLMs)的新發展,人們越來越關注如何將它們從圖像-文本數據擴展到更具...
馬斯克新作!Grok-1.5V多模態模型震撼發布:數字與物理世界完美融合
新智元報道編輯:編輯部 【新智元導讀】馬斯克xAI的多模態模型Grok-1.5V橫空出世了!不僅多項基準測試超越GPT-4V,而且看懂梗圖寫Python代碼也都不在話下。并...
馬斯克的首款多模態大模型來了,GPT-4V又被超越了一次
機器之心報道 機器之心編輯部自從 2023 年 11 月 Grok 首次亮相以來,馬斯克的 xAI 正在大模型領域不斷取得進步,向 OpenAI 等先行者發起進攻。在 Grok-1 開...
鑰匙忘哪不知道,機器人幫你找!Meta最新開源OpenEQA,LeCun朝世界模型更近一步!
夕小瑤科技說 原創作者 | 任同學Yann LeCun 朝著 “世界模型” 又近了一步。 Meta最新的開源工作OpenEQA:從文字模型到世界模型,可以像人一樣記憶、推理的新基...