清華系出手,推出全面對(duì)標(biāo)Sora的視頻大模型
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:清華系出手,推出全面對(duì)標(biāo)Sora的視頻大模型
關(guān)鍵字:視頻,字節(jié)跳動(dòng),模型,鏡頭,架構(gòu)
文章來(lái)源:智東西
內(nèi)容字?jǐn)?shù):5278字
內(nèi)容摘要:
中國(guó)首個(gè)長(zhǎng)時(shí)長(zhǎng)、高一致性、高動(dòng)態(tài)性視頻大模型Vidu發(fā)布。
作者|ZeR0
編輯|漠影
智東西4月27日?qǐng)?bào)道,在今日舉行的2024中關(guān)村論壇人工智能主題日未來(lái)人工智能先鋒論壇上,清華大學(xué)教授、生數(shù)科技首席科學(xué)家朱軍宣布,生數(shù)科技與清華大合推出中國(guó)首個(gè)原創(chuàng)全自研長(zhǎng)時(shí)長(zhǎng)、高一致性、高動(dòng)態(tài)性的視頻大模型Vidu。
根據(jù)公開(kāi)融資信息,成立于去年3月的生數(shù)科技,是當(dāng)前主要國(guó)內(nèi)累計(jì)融資額及估值最高的類Sora創(chuàng)企,迄今已完成數(shù)億元融資,投資方包括百度風(fēng)投、智譜AI、螞蟻集團(tuán)以及創(chuàng)始成員多數(shù)來(lái)自于原字節(jié)跳動(dòng)投資團(tuán)隊(duì)的錦秋基金。
朱軍現(xiàn)場(chǎng)展示了Vidu與Pika、Gen-2、Sora等行業(yè)現(xiàn)有文生視頻大模型的生成視頻效果對(duì)比。他評(píng)價(jià)說(shuō),Vidu在16秒長(zhǎng)期保持和語(yǔ)義理解等方面表現(xiàn)得非常突出。
▲使用相同提示詞,Vidu與Pika、Gen-2生成視頻對(duì)比
▲使用相同提示詞,Vidu與Sora生成視頻對(duì)比
▲Vidu生成視頻的部分動(dòng)圖
Vidu能根據(jù)文本描述直接生成16秒高質(zhì)量視頻,且生成視頻流暢連貫,沒(méi)有明顯的插幀現(xiàn)象。據(jù)介紹,這是因?yàn)閂idu采用的是“一步到位”的生成方式,與Sora一樣,文本到視
原文鏈接:清華系出手,推出全面對(duì)標(biāo)Sora的視頻大模型
聯(lián)系作者
文章來(lái)源:智東西
作者微信:zhidxcom
作者簡(jiǎn)介:智能產(chǎn)業(yè)新媒體!智東西專注報(bào)道人工智能主導(dǎo)的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來(lái)的千行百業(yè)產(chǎn)業(yè)升級(jí)。聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。