實測13個類Sora視頻生成模型,8000多個案例,一次看個夠

AIGC動態(tài)歡迎閱讀
原標(biāo)題:實測13個類Sora視頻生成模型,8000多個案例,一次看個夠
關(guān)鍵字:騰訊,報告,模型,視頻,提示
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進(jìn)了學(xué)術(shù)交流與傳播。如果您有優(yōu)秀的工作想要分享,歡迎投稿或者聯(lián)系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com作者團(tuán)隊介紹:本文作者主要來自騰訊 AI Lab,作者分別是曾愛玲,騰訊 AI 資深研究員;來自中科大的楊雨航,主要研究方向是人與物互動的理解與生成;陳衛(wèi)東,騰訊 AI 資深研究員;劉威,騰訊杰出科學(xué)家,IEEE fellow。
最近,騰訊 AI Lab 聯(lián)合中科大發(fā)布了一份針對類 SORA 視頻生成模型的測評報告,重點聚焦目前最前沿的類 SORA DiT 架構(gòu)的高質(zhì)量視頻生成閉源模型,產(chǎn)品以及部分開源模型評估,從技術(shù)上,這些模型相較于之前 Stable Diffusion 類的視頻模型不僅全面提升了畫質(zhì),還在動作自然度和多樣性、視覺 – 語言對齊以及控制精度上做出了顯著進(jìn)步,測評涵蓋了從文生視頻(T2V)、圖生視頻(I2V)以及視頻到視頻(V2V)生成模型全
原文鏈接:實測13個類Sora視頻生成模型,8000多個案例,一次看個夠
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:
作者簡介:

粵公網(wǎng)安備 44011502001135號