怒斥Sora之后,LeCun放出「視覺世界模型」論文,揭示AI學(xué)習(xí)物理世界的關(guān)鍵?
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:怒斥Sora之后,LeCun放出「視覺世界模型」論文,揭示AI學(xué)習(xí)物理世界的關(guān)鍵?
關(guān)鍵字:模型,表征,世界,任務(wù),研究者
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):8874字
內(nèi)容摘要:
機(jī)器之心報(bào)道
機(jī)器之心編輯部Sora 的發(fā)布讓整個(gè) AI 領(lǐng)域?yàn)橹駳g,但 LeCun 是個(gè)例外。
面對(duì) OpenAI 源源不斷放出的 Sora 生成視頻,LeCun 熱衷于尋找其中的失誤:歸根結(jié)底,LeCun 針對(duì)的不是 Sora,而是 OpenAI 從 ChatGPT 到 Sora 一致采用的自回歸生成式路線。
LeCun 一直認(rèn)為, GPT 系列 LLM 模型所依賴的自回歸學(xué)習(xí)范式對(duì)世界的理解非常膚淺,遠(yuǎn)遠(yuǎn)比不上真正的「世界模型」。
所以,一遇到「Sora 是世界模型」的說法,LeCun 就有些坐不?。骸竷H僅根據(jù) prompt 生成逼真視頻并不能代表一個(gè)模型理解了物理世界,生成視頻的過程與基于世界模型的因果預(yù)測(cè)完全不同?!鼓敲?,面對(duì)視覺任務(wù),世界模型如何獲得自回歸模型一般的性能?
最近,Lecun 發(fā)布了自己關(guān)于「世界模型」的新論文《在視覺表征學(xué)習(xí)中學(xué)習(xí)和利用世界模型》,剛好解釋了這個(gè)問題。論文標(biāo)題:Learning and Leveraging World Models in Visual Representation Learning
論文鏈接:https://arxiv.o
原文鏈接:怒斥Sora之后,LeCun放出「視覺世界模型」論文,揭示AI學(xué)習(xí)物理世界的關(guān)鍵?
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡(jiǎn)介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)