LeCun贊轉(zhuǎn)!類Sora模型能否理解物理規(guī)律?字節(jié)豆包大模型團隊系統(tǒng)性研究揭秘
AIGC動態(tài)歡迎閱讀
原標(biāo)題:LeCun贊轉(zhuǎn)!類Sora模型能否理解物理規(guī)律?字節(jié)豆包大模型團隊系統(tǒng)性研究揭秘
關(guān)鍵字:模型,視頻,物理,數(shù)據(jù),團隊
文章來源:機器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
機器之心發(fā)布
機器之心編輯部視頻生成模型雖然可以生成一些看似符合常識的視頻,但被證實目前還無法理解物理規(guī)律!
自從 Sora 橫空出世,業(yè)界便掀起了一場「視頻生成模型到底懂不懂物理規(guī)律」的爭論。圖靈獎得主 Yann LeCun 明確表示,基于文本提示生成的逼真視頻并不代表模型真正理解了物理世界。之后更是直言,像 Sora 這樣通過生成像素來建模世界的方式注定要失敗。Keras 之父 Fran?ois Chollet 則認(rèn)為,Sora 這樣的視頻生成模型確實嵌入了「物理模型」,但問題是:這個物理模型是否準(zhǔn)確?它能否泛化到新的情況,即那些不僅僅是訓(xùn)練數(shù)據(jù)插值的情形?這些問題至關(guān)重要,決定了生成圖像的應(yīng)用范圍 —— 是僅限于媒體生產(chǎn),還是可以用作現(xiàn)實世界的可靠模擬。最后他指出,不能簡單地通過擬合大量數(shù)據(jù)來期望得到一個能夠泛化到現(xiàn)實世界所有可能情況的模型。此后,關(guān)于視頻生成模型到底有沒有在學(xué)習(xí)、理解物理規(guī)律,業(yè)界始終沒有一個定論。直到近日,字節(jié)豆包大模型團隊公布的一項系統(tǒng)性研究,為兩者之間的關(guān)系「劃上了不等號」。
該團隊通過大規(guī)模實驗發(fā)現(xiàn) —— 即便依照 Scaling Law 擴大模型參數(shù)與
原文鏈接:LeCun贊轉(zhuǎn)!類Sora模型能否理解物理規(guī)律?字節(jié)豆包大模型團隊系統(tǒng)性研究揭秘
聯(lián)系作者
文章來源:機器之心
作者微信:
作者簡介: