“很接近Sora”,直擊清華團(tuán)隊視頻大模型Vidu發(fā)布現(xiàn)場|甲子光年

AIGC動態(tài)歡迎閱讀
原標(biāo)題:“很接近Sora”,直擊清華團(tuán)隊視頻大模型Vidu發(fā)布現(xiàn)場|甲子光年
關(guān)鍵字:視頻,模型,團(tuán)隊,報告,人工智能
文章來源:甲子光年
內(nèi)容字?jǐn)?shù):7853字
內(nèi)容摘要:
中國首個長時長、高一致性、高動態(tài)性視頻大模型。作者|王博
事先沒有一點聲張,今天上午,中國首個長時長、高一致性、高動態(tài)性視頻大模型Vidu就在中關(guān)村論壇未來人工智能先鋒論壇上發(fā)布了。
當(dāng)清華大學(xué)人工智能研究院副院長、生數(shù)科技首席科學(xué)家朱軍放完Vidu的演示視頻,現(xiàn)場響起了5秒以上的掌聲。
“已經(jīng)很接近Sora了!”“生成質(zhì)量很好。”在場多位觀眾感嘆。
從2月份Sora席卷全球,再到近期Adobe旗下的視頻剪輯軟件Premiere Pro引入Sora、Runway、Pika等AI視頻工具,海外的視頻賽道正熱火朝天。相比之下,國內(nèi)似乎一直在等待好消息的過程中。
過去的兩個月,雖然行業(yè)內(nèi)陸續(xù)有一些宣稱追趕Sora、復(fù)現(xiàn)Sora的聲音,但進(jìn)展似乎并不明顯。直到今天一支短片的發(fā)布,Vidu給在場觀眾翻譯了一下——“什么叫驚喜”。1.Vidu帶來的驚喜
Vidu是生數(shù)科技聯(lián)合清華大學(xué)最新發(fā)布的視頻大模型,該模型采用團(tuán)隊原創(chuàng)的Diffusion與Transformer融合的架構(gòu)U-ViT,支持一鍵生成長達(dá)16秒、分辨率高達(dá)1080P的高清視頻內(nèi)容。
Vidu能夠根據(jù)提供的文本描述直接生成長達(dá)16秒的
原文鏈接:“很接近Sora”,直擊清華團(tuán)隊視頻大模型Vidu發(fā)布現(xiàn)場|甲子光年
聯(lián)系作者
文章來源:甲子光年
作者微信:jazzyear
作者簡介:甲子光年是一家科技智庫,包含智庫、社群、企業(yè)服務(wù)版塊,立足中國科技創(chuàng)新前沿陣地,動態(tài)跟蹤頭部科技企業(yè)發(fā)展和傳統(tǒng)產(chǎn)業(yè)技術(shù)升級案例,推動人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)、云計算、新能源、新材料、信息安全、大健康等科技創(chuàng)新在產(chǎn)業(yè)中的應(yīng)用與落地。

粵公網(wǎng)安備 44011502001135號