標簽:任務
北大推出全新機器人多模態大模型!面向通用和機器人場景的高效推理和操作
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
2024KDD挑戰任務,GPT-4僅得40分,Meta發布最新RAG評價基準
夕小瑤科技說 原創作者 | Axe_越眾所周知,“要想富,先修路”,經常挖路的同學應該知道,要想修好一條路,首先就必須搞清楚關于道路質量的統一驗收標準,否則...
ACL2024:浙江大學提出大小模型協同的跨文檔理解,低成本高表現
夕小瑤科技說 原創作者 | Richard 自大模型出現以來,其在自然語言處理領域取得了令人矚目的進展。然而如何有效地將大模型應用于具體的任務中,仍面臨諸多挑...
王興興、王鶴、盧宗青、邵林、高陽等專家共論具身前沿
大數據文摘受權轉載自智源社區 從Figure01和人類交流自如、特斯拉Optimus疊襯衫,以及宇樹G1驚艷發布,再到公眾對人形機器人的爭相追逐可以看出,具身智能是2...
拯救Transformer推理能力!DeepMind新研究TransNAR:給模型嵌入「算法推理大腦」
新智元報道編輯:喬楊 好困 【新智元導讀】DeepMind最近發表的一篇論文提出用混合架構的方法解決Transformer模型的推理缺陷。將Transformer的NLU技能與基于GN...
答案抽取正確率達96.88%,xFinder斷了大模型「作弊」的小心思
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
ACL 2024論文蓋棺定論:大語言模型≠世界模擬器,Yann LeCun:太對了
機器之心報道 機器之心編輯部如果 GPT-4 在模擬基于常識任務的狀態變化時準確率都只有約 60%,那么我們還要考慮將大語言模型作為世界模擬器來使用嗎?最近兩...
Mobile-Agent-v2問世,自動化手機操作能力再上新臺階
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
萬字長文!AI Agent架構概況:關于推理、規劃和工具調用
??直播預告 | 6月18日上午10點,「智猩猩AI新青年講座」第240講正式開講,邀請到德州大學奧斯汀分校劉星超博士將直播講解《利用直線概率流加速Stable Diffusi...
大模型理解復雜表格,字節&中科大出手了
允中 發自 凹非寺量子位 | 公眾號 QbitAI只要一個大模型,就能解決打工人遇到的表格難題! 字節聯手中科大推出了一款統一表格理解大模型,可以以用戶友好的方...
2.5%KV緩存保持大模型90%性能,大模型金字塔式信息匯聚模式探秘|開源
蔡澤凡 投稿量子位 | 公眾號 QbitAI用KV緩存加速大模型的顯存瓶頸,終于迎來突破。 北大、威斯康辛-麥迪遜、微軟等聯合團隊提出了全新的緩存分配方案,只用2....
一句話手機自己打車,開源多智能體AI助手,非蘋果手機也能玩
Mobile-Agent團隊 投稿量子位 | 公眾號 QbitAI一句話讓AI自動化操作手機,打個車已經不是難事了。 從官方公布的演示視頻來看,用戶只需要說出目的地,Agent就...
打通智能體「自我進化」全流程!復旦推出通用智能體平臺AgentGym
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
全華人團隊推出多模態大模型新基準,GPT-4o準確率僅為65.5%,所有模型最易犯感知錯誤
王家豪 投稿自 凹非寺量子位 | 公眾號 QbitAIGPT-4o再次掀起多模態大模型的浪潮。 如果他們能以近似人類的熟練程度,在不同領域執行廣泛的任務,這對許多領域...
預測準確率達95.7%,ChatMOF利用LLM預測和生成金屬有機框架
將 ScienceAI設為星標 第一時間掌握 新鮮的 AI for Science 資訊編輯|X 金屬有機框架(MOF)因其孔隙率大、表面積大和出色的可調性而用于許多化學應用。然而...