AIGC動態歡迎閱讀
原標題:LLaMA 3:大模型之戰的新序幕
關鍵字:模型,數據,報告,文本,視頻
文章來源:人工智能學家
內容字數:13602字
內容摘要:
作者 | 符堯
OneFlow編譯
翻譯|楊婷、宛子琳、張雪聃
本文要點概覽:
文本數據的擴展可能已經達到了極限,因為易于獲取的網絡文本資源(如Common Crawl、GitHub、ArXiv等)已基本被充分利用。
盡管如此,通過更深入地挖掘互聯網資源、搜尋圖書館藏書及使用合成數據,我們仍有望獲得新的文本數據,但要實現數據量級的大幅提升卻面臨重重挑戰——這些新增的數據更可能是當前數量級上的增量。
規模擴展競賽的新階段將轉向多模態領域,尤其是統一的視頻-語言生成模型,因為僅有視頻數據可以實現數量級的增長。
然而,壞消息是,視頻數據似乎并不能顯著提升模型的推理(reasoning)能力,而這一能力是區分模型強弱的首要指標。
但好消息是,視頻數據能夠帶來其他性能的顯著提升,尤其是增強了模型與現實世界的聯系,展現出成為神經世界模型(neural world model)的巨大潛力(與Zelda等硬編碼物理引擎不同),這提供了從模擬物理反饋中學習的可能性。
從X(X表示人類、人工智能和環境反饋)反饋中擴展強化學習可能是持續提升模型推理能力最有前景的路徑。
類似于AlphaGo Zero在圍棋領
原文鏈接:LLaMA 3:大模型之戰的新序幕
聯系作者
文章來源:人工智能學家
作者微信:AItists
作者簡介:致力成為權威的人工智能科技媒體和前沿科技研究機構
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...