AIGC動態歡迎閱讀
原標題:Meta Movie Gen:新的 SOTA 視頻生成模型-技術報告解讀
關鍵字:模型,視頻,文本,作者,數據
文章來源:智猩猩GenAI
內容字數:0字
內容摘要:
01背景前段時間 Meta 發布了對標 OpenAI SORA 和快手可靈的視頻生成模型 Movie Gen,這里我們進行相關的技術解讀。本文主要聚焦在其圖像和視頻生成模型部分,進行詳細介紹;然后對視頻個性化、編輯和音頻生成進行簡單概述。
對應的論文:Movie Gen: A Cast of Media Foundation Models
對應的 Blog:How Meta Movie Gen could usher in a new AI-enabled era for content creators
02摘要Movie Gen 是一組基礎模型,可生成具有不同寬高比、同步音頻的高質量 1080P 高清視頻。此外,作者還展示了其他的能力,比如基于指令的精確視頻編輯、根據用戶圖像生成個性化視頻等。
作者的模型在多個任務上都達到了新的 SOTA 水平,包括:文本->視頻生成、視頻個性化、視頻編輯、視頻->音頻生成、文本->音頻生成等。
最大的視頻生成模型是一個 30B 參數的 Transformer 模型,經過訓練,最大上下文長度可達 73K 視頻 Token,對應以每秒 16 幀的速度
原文鏈接:Meta Movie Gen:新的 SOTA 視頻生成模型-技術報告解讀
聯系作者
文章來源:智猩猩GenAI
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...