標簽:任務
SuperBench大模型綜合能力評測報告
在2023年的“百模大戰”中,眾多實踐者推出了各類模型,這些模型有的是原創的,有的是針對開源模型進行微調的;有些是通用的,有些則是行業特定的。如何能合理...
無任務學習及在機器人任務和規劃中的應用
大數據文摘授權轉載自中國人工智能學會 作者:張憲琦,范曉鵬摘 要: 本文提出了無任務學習的方法,闡述了其與現有方法(包括自監督學習、遷移學習、模仿學習...
兩萬字實錄:該怎么讓機器人吃下大模型?
機器人真正融入開放式服務場景,還差哪一步?來源:AI科技評論 作者:吳彤 編輯:麥廣煒 大模型技術橫空出世,無疑讓機器人技術再次成為研究和產業界的焦點。...
新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2
新智元報道編輯:桃子 好困 【新智元導讀】Transformer王座即將被取而代之!Meta、USC、CMU和UCSD聯合提出了革命性新架構Megalodon,能夠處理無限上下文,在2...
用MoE橫掃99個子任務!浙大等提出全新通用機器人策略GeRM
新智元報道編輯:LRS 【新智元導讀】本文分享論文GeRM: A Generalist Robotic Model with Mixture-of-experts for Quadruped Robot,由西湖大學和浙江大學聯...
兩萬字實錄:該怎么讓機器人吃下大模型?丨GAIR live
機器人真正融入開放式服務場景,還差哪一步?作者|吳彤 編輯|麥廣煒 大模型技術橫空出世,無疑讓機器人技術再次成為研究和產業界的焦點。 這一技術的核心優...
世界首個AI程序員Devin視頻竟造假?博主逐幀解析,Devin代碼任務完成很糟糕
新智元報道編輯:桃子 【新智元導讀】全球首個AI程序員Devin被爆視頻造假?YouTube博主近日揭露了背后明星初創公司Cognition的謊言,通過逐幀分析發現,Devin...
「大模型+強化學習」最新綜述!港中文深圳130余篇論文:詳解四條主流技術路線
新智元報道編輯:LRS 【新智元導讀】用大模型來輔助強化學習,可以提高模型在多任務學習、樣本利用率、任務規劃等復雜任務下的能力,該論文綜述了LLM-enhance...
大模型做時序預測也很強!華人團隊激活LLM新能力,超越一眾傳統模型實現SOTA
蔚明 投稿自 凹非寺量子位 | 公眾號 QbitAI大語言模型潛力被激發—— 無需訓練大語言模型就能實現高精度時序預測,超越一切傳統時序模型。 來自蒙納士大學、螞...
超越GPT-4V,蘋果多模態大模型上新!
新智元報道編輯:flynne 【新智元導讀】蘋果開發的多模態模型Ferret-UI增強了對屏幕的理解和交互,在引用、基礎和推理方面表現出了卓越的性能,這些增強功能...
蘋果發布多模態模型 Ferret-UI,部分手機 UI 任務超越 GPT-4V
手機廠商自研的端側模型功能,會超越純正的大模型團隊嗎?編譯 | 賴文昕 編輯 | 陳彩嫻 大模型的誕生,讓科技巨頭與創業公司們在新一輪的競賽中再次鳴槍出發...
Scaling Laws又失靈了?谷歌新研究:擴散模型不是越大越好
大數據文摘授權轉載自夕小瑤科技說作者:Zicy 近年來,模型規模呈現出愈來愈大的趨勢,越來越多的人相信“力大磚飛”。 OpenAI 雖然沒有公布Sora的訓練細節,但...
多模態大模型有了統一分割框架,華科PSALM多任務登頂,模型代碼全開源
機器之心專欄 機器之心編輯部最近,多模態大模型(LMM)取得了一系列引人注目的成就,特別是在視覺 - 語言任務上的表現令人矚目。它們的成功不僅展現了多模態...
Scaling Laws 又失靈了?谷歌新研究:擴散模型不是越大越好
夕小瑤科技說 原創作者 | Zicy近年來,模型規模呈現出愈來愈大的趨勢,越來越多的人相信“力大磚飛”。 OpenAI 雖然沒有公布Sora的訓練細節,但在Sora的技術報...
人民大學:揭示大語言模型事實召回的關鍵機制
夕小瑤科技說 原創來源 | 芒果 引言:大語言模型事實召回機制探索該論文深入研究了基于Transformer的語言模型在零射擊和少射擊場景下的事實記憶任務機制。模...
粵公網安備 44011502001135號