實測13個類Sora視頻生成模型，8000多個案例，一次看個夠

AIGC動態(tài)1年前 (2024)發(fā)布機(jī)器之心

AIGC動態(tài)歡迎閱讀

原標(biāo)題：實測13個類Sora視頻生成模型，8000多個案例，一次看個夠
關(guān)鍵字：騰訊,報告,模型,視頻,提示
文章來源：機(jī)器之心
內(nèi)容字?jǐn)?shù)：0字

內(nèi)容摘要：

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年，機(jī)器之心AIxiv專欄接收報道了2000多篇內(nèi)容，覆蓋全球各大高校與企業(yè)的頂級實驗室，有效促進(jìn)了學(xué)術(shù)交流與傳播。如果您有優(yōu)秀的工作想要分享，歡迎投稿或者聯(lián)系報道。投稿郵箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com作者團(tuán)隊介紹：本文作者主要來自騰訊 AI Lab，作者分別是曾愛玲，騰訊 AI 資深研究員；來自中科大的楊雨航，主要研究方向是人與物互動的理解與生成；陳衛(wèi)東，騰訊 AI 資深研究員；劉威，騰訊杰出科學(xué)家，IEEE fellow。
最近，騰訊 AI Lab 聯(lián)合中科大發(fā)布了一份針對類 SORA 視頻生成模型的測評報告，重點聚焦目前最前沿的類 SORA DiT 架構(gòu)的高質(zhì)量視頻生成閉源模型，產(chǎn)品以及部分開源模型評估，從技術(shù)上，這些模型相較于之前 Stable Diffusion 類的視頻模型不僅全面提升了畫質(zhì)，還在動作自然度和多樣性、視覺 – 語言對齊以及控制精度上做出了顯著進(jìn)步，測評涵蓋了從文生視頻（T2V）、圖生視頻（I2V）以及視頻到視頻（V2V）生成模型全

原文鏈接：實測13個類Sora視頻生成模型，8000多個案例，一次看個夠