清華團隊國產(chǎn)“Sora”火了!畫面效果對標OpenAI,長度可達16秒,還能讀懂物理規(guī)律
AIGC動態(tài)歡迎閱讀
原標題:清華團隊國產(chǎn)“Sora”火了!畫面效果對標OpenAI,長度可達16秒,還能讀懂物理規(guī)律
關(guān)鍵字:視頻,畫面,模型,架構(gòu),鏡頭
文章來源:量子位
內(nèi)容字數(shù):8518字
內(nèi)容摘要:
允中 發(fā)自 凹非寺量子位 | 公眾號 QbitAISora席卷世界,也掀起了全球競逐AI視頻生成的熱潮。
就在今天,國內(nèi)又有一支短片引發(fā)關(guān)注。
視頻來自生數(shù)科技聯(lián)合清華大學(xué)最新發(fā)布的視頻大模型「Vidu」。
從官宣消息看,「Vidu」支持一鍵生成長達16秒、分辨率達1080p的高清視頻內(nèi)容。
更令人驚喜的是,「Vidu」畫面效果非常接近Sora,在多鏡頭語言、時間和空間一致性、遵循物理規(guī)律等方面表現(xiàn)都十分出色,而且還能虛構(gòu)出真實世界不存在的超現(xiàn)實主義畫面,這是當(dāng)前的視頻生成模型難以實現(xiàn)的。
并且實現(xiàn)這般效果,背后團隊只用了兩個月的時間。
全面對標Sora3月中旬,生數(shù)科技聯(lián)合創(chuàng)始人兼CEO唐家渝就曾公開表示:“今年內(nèi)一定能達到Sora目前版本的效果。”
現(xiàn)在,在生成時長、時空一致性、鏡頭語言、物理模擬等方面,確實能看到「Vidu」在短時間內(nèi)已經(jīng)逼近Sora水平。
長度突破10秒大關(guān)「Vidu」生成的視頻不再是持續(xù)幾秒的「GIF」,而是達到了16秒,并且做到了畫面連續(xù)流暢,且有細節(jié)、邏輯連貫。
盡管都是畫面,但幾乎不會出現(xiàn)穿模、鬼影、不符合現(xiàn)實規(guī)律的問題。
△提示:一艘木頭玩具船
原文鏈接:清華團隊國產(chǎn)“Sora”火了!畫面效果對標OpenAI,長度可達16秒,還能讀懂物理規(guī)律
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破