全方位超越 Sora,Meta 最新的 AI 視頻模型到底強(qiáng)在哪里?
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:全方位超越 Sora,Meta 最新的 AI 視頻模型到底強(qiáng)在哪里?
關(guān)鍵字:解讀,視頻,模型,畫面,文本
文章來源:愛范兒
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
全能生成王這兩天,視頻生成模型領(lǐng)域因?yàn)?Meta Movie Gen 的發(fā)布,又炸開了鍋。
行業(yè)內(nèi)外感嘆最多的地方,無外乎兩點(diǎn),一是生成效果自然逼真,還能同步生成與畫面匹配的聲音,很像當(dāng)時(shí) Sora 發(fā)布后引起的討論和轟動(dòng);二是 Meta AI 的新模型自定義性很強(qiáng),無論是視頻畫面比例,還是視頻元素與細(xì)節(jié),都能根據(jù)用戶的需求進(jìn)行調(diào)整。所以,可能會(huì)引領(lǐng)視頻生成新變革的 Meta Movie Gen 到底有哪些細(xì)節(jié)?這些在官網(wǎng)和演示視頻里的驚艷效果是怎么煉成的?Meta AI 的視頻模型負(fù)責(zé)人 Andrew Brown 專門為 Meta Movie Gen 的理論技術(shù)做了解讀:
Movie Gen 在整體質(zhì)量和一致性方面顯著優(yōu)于 Sora。真實(shí)性和美觀性考驗(yàn)照片寫實(shí)性,Movie Gen 全面獲勝。Meta Movie Gen 是一組可以進(jìn)行文本到視頻生成、文本到圖像生成、個(gè)性化、編輯和視頻到音頻生成的模型。擴(kuò)展數(shù)據(jù)、計(jì)算和模型參數(shù)非常重要,將其與流匹配相結(jié)合,并轉(zhuǎn)向簡單的常用 LLM 架構(gòu) (Llama),從而實(shí)現(xiàn)了 SOTA 視頻生成質(zhì)量。我們(Meta AI)是第一個(gè)使用 Llama
原文鏈接:全方位超越 Sora,Meta 最新的 AI 視頻模型到底強(qiáng)在哪里?
聯(lián)系作者
文章來源:愛范兒
作者微信:
作者簡介: