清華系出手,推出全面對標(biāo)Sora的視頻大模型
AIGC動態(tài)歡迎閱讀
原標(biāo)題:清華系出手,推出全面對標(biāo)Sora的視頻大模型
關(guān)鍵字:視頻,字節(jié)跳動,模型,鏡頭,架構(gòu)
文章來源:智東西
內(nèi)容字數(shù):5278字
內(nèi)容摘要:
中國首個長時長、高一致性、高動態(tài)性視頻大模型Vidu發(fā)布。
作者|ZeR0
編輯|漠影
智東西4月27日報道,在今日舉行的2024中關(guān)村論壇人工智能主題日未來人工智能先鋒論壇上,清華大學(xué)教授、生數(shù)科技首席科學(xué)家朱軍宣布,生數(shù)科技與清華大合推出中國首個原創(chuàng)全自研長時長、高一致性、高動態(tài)性的視頻大模型Vidu。
根據(jù)公開融資信息,成立于去年3月的生數(shù)科技,是當(dāng)前主要國內(nèi)累計融資額及估值最高的類Sora創(chuàng)企,迄今已完成數(shù)億元融資,投資方包括百度風(fēng)投、智譜AI、螞蟻集團以及創(chuàng)始成員多數(shù)來自于原字節(jié)跳動投資團隊的錦秋基金。
朱軍現(xiàn)場展示了Vidu與Pika、Gen-2、Sora等行業(yè)現(xiàn)有文生視頻大模型的生成視頻效果對比。他評價說,Vidu在16秒長期保持和語義理解等方面表現(xiàn)得非常突出。
▲使用相同提示詞,Vidu與Pika、Gen-2生成視頻對比
▲使用相同提示詞,Vidu與Sora生成視頻對比
▲Vidu生成視頻的部分動圖
Vidu能根據(jù)文本描述直接生成16秒高質(zhì)量視頻,且生成視頻流暢連貫,沒有明顯的插幀現(xiàn)象。據(jù)介紹,這是因為Vidu采用的是“一步到位”的生成方式,與Sora一樣,文本到視
原文鏈接:清華系出手,推出全面對標(biāo)Sora的視頻大模型
聯(lián)系作者
文章來源:智東西
作者微信:zhidxcom
作者簡介:智能產(chǎn)業(yè)新媒體!智東西專注報道人工智能主導(dǎo)的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)升級。聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。
相關(guān)文章
