字節最新文生視頻模型，引發圍觀！狐貍跳舞超絲滑，效果超Gen-2

AIGC動態2年前 (2024)發布夕小瑤科技說

AIGC動態歡迎閱讀

原標題：字節最新文生視頻模型，引發圍觀！狐貍跳舞超絲滑，效果超Gen-2
關鍵字：視頻,模塊,圖像,文本,模型
文章來源：夕小瑤科技說
內容字數：4295字

內容摘要：

夕小瑤科技說原創作者 | 謝年年、python擴散模型帶動了文生視頻領域的發展。Runway、Pika 1.0、Morph、Moon Valley和Stable Video Diffusion model等模型在文生視頻界嶄露頭角。只需文本描述，就能輕松生成視頻。讓人不禁感嘆，世界已經發展成這樣了嗎?
國內公司也不甘示弱，字節團隊最近發布了一個新的多級文生視頻框架——MagicVideo-V2，集成了文本到圖像(T2I)，圖像到視頻(I2V)、視頻到視頻(V2V)和視頻幀插值(VFI)模塊組成多級端到端視頻生成pipeline，能夠根據文本描述生成美觀且高分辨率的視頻，在人工評估中，其性能優于上面提到的一些明星文生視頻產品。
論文標題:MagicVideo-V2: Multi-Stage High-Aesthetic Video Generation
論文鏈接:https://arxiv.org/pdf/2401.04468.pdf
先來看看效果到底如何~更多示例與對比高清視頻可在官方發布的鏈接中找到：https://magicvideov2.github.io/
模型結構如圖所示，

原文鏈接：字節最新文生視頻模型，引發圍觀！狐貍跳舞超絲滑，效果超Gen-2