AIGC動態歡迎閱讀
原標題:字節最新文生視頻模型,引發圍觀!狐貍跳舞超絲滑,效果超Gen-2
關鍵字:視頻,模塊,圖像,文本,模型
文章來源:夕小瑤科技說
內容字數:4295字
內容摘要:
夕小瑤科技說 原創作者 | 謝年年、python擴散模型帶動了文生視頻領域的發展。Runway、Pika 1.0、Morph、Moon Valley和Stable Video Diffusion model等模型在文生視頻界嶄露頭角。只需文本描述,就能輕松生成視頻。讓人不禁感嘆,世界已經發展成這樣了嗎?
國內公司也不甘示弱,字節團隊最近發布了一個新的多級文生視頻框架——MagicVideo-V2,集成了文本到圖像(T2I),圖像到視頻(I2V)、視頻到視頻(V2V)和視頻幀插值(VFI)模塊組成多級端到端視頻生成pipeline,能夠根據文本描述生成美觀且高分辨率的視頻,在人工評估中,其性能優于上面提到的一些明星文生視頻產品。
論文標題:MagicVideo-V2: Multi-Stage High-Aesthetic Video Generation
論文鏈接:https://arxiv.org/pdf/2401.04468.pdf
先來看看效果到底如何~更多示例與對比高清視頻可在官方發布的鏈接中找到:https://magicvideov2.github.io/
模型結構如圖所示,
原文鏈接:字節最新文生視頻模型,引發圍觀!狐貍跳舞超絲滑,效果超Gen-2
聯系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:更快的AI前沿,更深的行業洞見。聚集25萬AI應用開發者、算法工程師和研究人員。一線作者均來自清北、國外頂級AI實驗室和互聯網大廠,兼備媒體sense與技術深度。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...