標(biāo)簽:基準(zhǔn)
60億AI獨角獸Mistral祭出磁力鏈,首個多模態(tài)Pixtral 12B登場!但被大佬曝出評測造假
新智元報道編輯:桃子 好困 【新智元導(dǎo)讀】一條磁力鏈,又在AI圈掀起狂瀾。成立一年法國AI獨角獸Mistral,官宣首個多模態(tài)模型Pixtral 12B,不僅能看懂手繪稿...
ACL杰出論文獎|GPT-4V暴露致命缺陷?JHU等發(fā)布首個多模態(tài)ToM 測試集,全面提升大模型心智能力
AIxiv專欄是機器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進了學(xué)術(shù)...
這就翻車了?Reflection 70B遭質(zhì)疑基模為Llama 3,作者:重新訓(xùn)練
機器之心報道 編輯:杜偉最近,開源大模型社區(qū)再次「熱鬧」了起來,主角是 AI 寫作初創(chuàng)公司 HyperWrite 開發(fā)的新模型 Reflection 70B。 它的底層模型建立在 M...
開源大模型新王干翻GPT-4o,新技術(shù)可糾正自己幻覺,數(shù)學(xué)99.2分刷爆測試集
西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號 QbitAI開源大模型王座突然易主,居然來自一家小創(chuàng)業(yè)團隊,瞬間引爆業(yè)界。 新模型名為Reflection 70B,使用一種全新訓(xùn)練技術(shù)...
AMD的GPU跑AI模型終于Yes了?PK英偉達(dá)H100不帶怕的
機器之心報道 編輯:Panda都很貴。AMD vs 英偉達(dá)絕對算是一個長盛不衰的話題 —— 從玩游戲用哪家強到如今訓(xùn)練 AI 哪個更高效?原因也很簡單:它們的 GPU 產(chǎn)品...
Mamba作者新作:將Llama3蒸餾成混合線性 RNN
機器之心報道 機器之心編輯部Transformer 在深度學(xué)習(xí)領(lǐng)域取得巨大成功的關(guān)鍵是注意力機制。注意力機制讓基于 Transformer 的模型關(guān)注與輸入序列相關(guān)的部分,...
英偉達(dá)Blackwell稱霸MLPerf!推理性能暴漲30倍,新一代「AI怪獸」誕生
新智元報道編輯:喬楊 好困 【新智元導(dǎo)讀】MLPerf Inference發(fā)布了最新測試結(jié)果,英偉達(dá)最新的Blackwell架構(gòu)芯片上場與谷歌、AMD同場競技,展現(xiàn)出明顯的性能...
微軟「小而美」系列三!視覺小鋼炮PK GPT-4o,MoE新秀力壓Llama 3.1
新智元報道編輯:耳朵 好困 【新智元導(dǎo)讀】微軟Phi 3.5系列上新了!mini模型小而更美,MoE模型首次亮相,vision模型專注多模態(tài)。就在今天,微軟「小語言模型...
謝謝微軟,又又又Open了!一口氣發(fā)布3款Phi-3.5新模型,領(lǐng)先Llama3.1和谷歌同級模型
夕小瑤科技說 原創(chuàng)作者 | 付奶茶家人們!微軟又用愛發(fā)電了!一覺醒來,微軟發(fā)布了最新的小模型三兄弟: Phi-3.5-MoE-instruct Phi-3.5-mini-instruct Phi-3.5...
LLM數(shù)學(xué)性能暴漲168%,微軟14人團隊力作!合成數(shù)據(jù)2.0秘訣曝光,智能體生成教學(xué)
新智元報道編輯:桃子 【新智元導(dǎo)讀】合成數(shù)據(jù)2.0秘訣曝光了!來自微軟的研究人員們提出了智能體框架AgentInstruct,能夠自動創(chuàng)建大量、多樣化的合成數(shù)據(jù)。經(jīng)...
同時操控手機和電腦,100項任務(wù),跨系統(tǒng)智能體評測基準(zhǔn)有了
AIxiv專欄是機器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進了學(xué)術(shù)...
非Transformer架構(gòu)站起來了!首個純無注意力大模型,超越開源巨頭Llama 3.1
機器之心報道 編輯:杜偉、陳陳Mamba 架構(gòu)的大模型又一次向 Transformer 發(fā)起了挑戰(zhàn)。Mamba 架構(gòu)模型這次終于要「站」起來了?自 2023 年 12 月首次推出以來...
ACL 2024 Oral|我們離真正的多模態(tài)思維鏈推理還有多遠(yuǎn)?
AIxiv專欄是機器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進了學(xué)術(shù)...
無比喻,不論文!用「畫家流水線」的方式理解Transformer中間層
新智元報道編輯:喬楊 庸庸 【新智元導(dǎo)讀】Transformer架構(gòu)層層堆疊,包含十幾億甚至幾十億個參數(shù),這些層到底是如何工作的?當(dāng)一個新奇的比喻——「畫家流水線...
Github 1.3K星的程序開發(fā)智能體!UIUC/CMU/耶魯?shù)嚷?lián)合發(fā)布OpenDevin技術(shù)報告
夕小瑤科技說 原創(chuàng)作者 | Axe_越如果說Agent(智能體)為LLM(大模型)找到了一個落地的方向,那么可以想象,一種能夠自動完成軟件開發(fā)、數(shù)據(jù)分析、網(wǎng)頁瀏覽...
粵公網(wǎng)安備 44011502001135號