全方位超越 Sora，Meta 最新的 AI 視頻模型到底強(qiáng)在哪里？

AIGC動(dòng)態(tài)1年前 (2024)發(fā)布愛(ài)范兒

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：全方位超越 Sora，Meta 最新的 AI 視頻模型到底強(qiáng)在哪里？
關(guān)鍵字：解讀,視頻,模型,畫(huà)面,文本
文章來(lái)源：愛(ài)范兒
內(nèi)容字?jǐn)?shù)：0字

內(nèi)容摘要：

全能生成王這兩天，視頻生成模型領(lǐng)域因?yàn)?Meta Movie Gen 的發(fā)布，又炸開(kāi)了鍋。
行業(yè)內(nèi)外感嘆最多的地方，無(wú)外乎兩點(diǎn)，一是生成效果自然逼真，還能同步生成與畫(huà)面匹配的聲音，很像當(dāng)時(shí) Sora 發(fā)布后引起的討論和轟動(dòng)；二是 Meta AI 的新模型自定義性很強(qiáng)，無(wú)論是視頻畫(huà)面比例，還是視頻元素與細(xì)節(jié)，都能根據(jù)用戶的需求進(jìn)行調(diào)整。所以，可能會(huì)引領(lǐng)視頻生成新變革的 Meta Movie Gen 到底有哪些細(xì)節(jié)？這些在官網(wǎng)和演示視頻里的驚艷效果是怎么煉成的？Meta AI 的視頻模型負(fù)責(zé)人 Andrew Brown 專門(mén)為 Meta Movie Gen 的理論技術(shù)做了解讀：
Movie Gen 在整體質(zhì)量和一致性方面顯著優(yōu)于 Sora。真實(shí)性和美觀性考驗(yàn)照片寫(xiě)實(shí)性，Movie Gen 全面獲勝。Meta Movie Gen 是一組可以進(jìn)行文本到視頻生成、文本到圖像生成、個(gè)性化、編輯和視頻到音頻生成的模型。擴(kuò)展數(shù)據(jù)、計(jì)算和模型參數(shù)非常重要，將其與流匹配相結(jié)合，并轉(zhuǎn)向簡(jiǎn)單的常用 LLM 架構(gòu) (Llama)，從而實(shí)現(xiàn)了 SOTA 視頻生成質(zhì)量。我們（Meta AI）是第一個(gè)使用 Llama

原文鏈接：全方位超越 Sora，Meta 最新的 AI 視頻模型到底強(qiáng)在哪里？