AIGC動態歡迎閱讀
原標題:哲學家萬字解析Sora本質,楊立昆點贊轉發,AI視頻離世界模擬器還有多遠?
關鍵字:報告,模型,物理,世界,視頻
文章來源:智東西
內容字數:21228字
內容摘要:
Sora是世界模擬器嗎?萬字長文深度解讀,楊立昆點贊。
編譯|香草
編輯|李水青
智東西3月8日報道,近日,深度學習三巨頭之一、Meta首席科學家楊立昆點贊分享了一篇萬字博文《視頻生成器是世界模擬器嗎?(Are Video Generation Models World Simulators?)》。
▲楊立昆在X平臺上轉發并稱這是一篇好文章
文章從Sora的工作原理、模擬假說、直觀物理學、世界模型的定義、圖像生成等角度,深入探討了標題所提出的問題,并得出結論:像Sora這樣的視頻生成器,可能不是人們想象中的“世界模擬器”,但從更寬泛的定義上來看,它們可以被視作有限的“世界模型”。
本文作者以文生圖模型為例證,論述了Sora可能和Stable Diffusion類似,生成過程超出了對像素空間表面統計的擬合,可能受到3D幾何和動態關鍵方面的潛在表示的影響,從而學到有用的深度、因果等特征的抽象表征。換句話說,Sora能在潛在空間中學習抽象規律,具有部分模擬世界的能力。
自Sora于今年初發布以來,“Sora是否理解物理世界”話題引來眾多大佬下場討論。其中英偉達的科學家Jim Fan將Sora
原文鏈接:哲學家萬字解析Sora本質,楊立昆點贊轉發,AI視頻離世界模擬器還有多遠?
聯系作者
文章來源:智東西
作者微信:zhidxcom
作者簡介:智能產業新媒體!智東西專注報道人工智能主導的前沿技術發展,和技術應用帶來的千行百業產業升級。聚焦智能變革,服務產業升級。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章

暫無評論...