清華系出手，推出全面對標(biāo)Sora的視頻大模型

AIGC動態(tài)2年前 (2024)發(fā)布智東西

AIGC動態(tài)歡迎閱讀

原標(biāo)題：清華系出手，推出全面對標(biāo)Sora的視頻大模型
關(guān)鍵字：視頻,字節(jié)跳動,模型,鏡頭,架構(gòu)
文章來源：智東西
內(nèi)容字?jǐn)?shù)：5278字

內(nèi)容摘要：

中國首個長時長、高一致性、高動態(tài)性視頻大模型Vidu發(fā)布。
作者|ZeR0
編輯|漠影
智東西4月27日報道，在今日舉行的2024中關(guān)村論壇人工智能主題日未來人工智能先鋒論壇上，清華大學(xué)教授、生數(shù)科技首席科學(xué)家朱軍宣布，生數(shù)科技與清華大合推出中國首個原創(chuàng)全自研長時長、高一致性、高動態(tài)性的視頻大模型Vidu。
根據(jù)公開融資信息，成立于去年3月的生數(shù)科技，是當(dāng)前主要國內(nèi)累計融資額及估值最高的類Sora創(chuàng)企，迄今已完成數(shù)億元融資，投資方包括百度風(fēng)投、智譜AI、螞蟻集團以及創(chuàng)始成員多數(shù)來自于原字節(jié)跳動投資團隊的錦秋基金。
朱軍現(xiàn)場展示了Vidu與Pika、Gen-2、Sora等行業(yè)現(xiàn)有文生視頻大模型的生成視頻效果對比。他評價說，Vidu在16秒長期保持和語義理解等方面表現(xiàn)得非常突出。
▲使用相同提示詞，Vidu與Pika、Gen-2生成視頻對比
▲使用相同提示詞，Vidu與Sora生成視頻對比
▲Vidu生成視頻的部分動圖
Vidu能根據(jù)文本描述直接生成16秒高質(zhì)量視頻，且生成視頻流暢連貫，沒有明顯的插幀現(xiàn)象。據(jù)介紹，這是因為Vidu采用的是“一步到位”的生成方式，與Sora一樣，文本到視

原文鏈接：清華系出手，推出全面對標(biāo)Sora的視頻大模型

聯(lián)系作者

文章來源：智東西
作者微信：zhidxcom
作者簡介：智能產(chǎn)業(yè)新媒體！智東西專注報道人工智能主導(dǎo)的前沿技術(shù)發(fā)展，和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)升級。聚焦智能變革，服務(wù)產(chǎn)業(yè)升級。

閱讀原文