Sora到底懂不懂物理世界?一場頭腦風(fēng)暴正在AI圈大佬間展開
AIGC動態(tài)歡迎閱讀
原標(biāo)題:Sora到底懂不懂物理世界?一場頭腦風(fēng)暴正在AI圈大佬間展開
關(guān)鍵字:模型,物理,視頻,數(shù)據(jù),世界
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):8347字
內(nèi)容摘要:
機(jī)器之心報道
編輯:張倩、杜偉Sora 到底是不是物理引擎甚至世界模型?圖靈獎得主 Yann LeCun、Keras 之父 Francois Chollet 等人正在深入探討。
最近幾天,OpenAI 發(fā)布的視頻生成模型 Sora 成了全世界關(guān)注的焦點。【關(guān)注機(jī)器之心視頻號,第一時間看到有趣的 AI 內(nèi)容】
和以往只能生成幾秒鐘視頻的模型不同,Sora 把生成視頻的長度一下子拉長到 60 秒。而且,它不僅能了解用戶在 Prompt 中提出的要求,還能 get 到人、物在物理世界中的存在方式。
以經(jīng)典的「海盜船在咖啡杯中纏斗」為例。為了讓生成效果看起來逼真,Sora 需要克服以下幾個物理難點:
規(guī)模和比例的適應(yīng):將海盜船縮小到能夠在咖啡杯中纏斗的尺寸,同時保持它們的細(xì)節(jié)和結(jié)構(gòu),是一個挑戰(zhàn)。AI 需要理解和調(diào)整這些對象在現(xiàn)實生活中的相對尺寸,使得場景在視覺上顯得合理;
流體動力學(xué):咖啡杯中的液體會對海盜船的產(chǎn)生影響。AI 模型需要模擬液體動力學(xué)的效果,包括波浪、濺水和船只移動時液體的流動,這在計算上是復(fù)雜的;
光線和陰影的處理:為了使場景看起來真實,AI 需要精確地模擬光線如何照射在這
原文鏈接:Sora到底懂不懂物理世界?一場頭腦風(fēng)暴正在AI圈大佬間展開
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺