字節(jié)最新文生視頻模型,引發(fā)圍觀!狐貍跳舞超絲滑,效果超Gen-2
AIGC動態(tài)歡迎閱讀
原標(biāo)題:字節(jié)最新文生視頻模型,引發(fā)圍觀!狐貍跳舞超絲滑,效果超Gen-2
關(guān)鍵字:視頻,模塊,圖像,文本,模型
文章來源:夕小瑤科技說
內(nèi)容字?jǐn)?shù):4295字
內(nèi)容摘要:
夕小瑤科技說 原創(chuàng)作者 | 謝年年、python擴(kuò)散模型帶動了文生視頻領(lǐng)域的發(fā)展。Runway、Pika 1.0、Morph、Moon Valley和Stable Video Diffusion model等模型在文生視頻界嶄露頭角。只需文本描述,就能輕松生成視頻。讓人不禁感嘆,世界已經(jīng)發(fā)展成這樣了嗎?
國內(nèi)公司也不甘示弱,字節(jié)團(tuán)隊(duì)最近發(fā)布了一個(gè)新的多級文生視頻框架——MagicVideo-V2,集成了文本到圖像(T2I),圖像到視頻(I2V)、視頻到視頻(V2V)和視頻幀插值(VFI)模塊組成多級端到端視頻生成pipeline,能夠根據(jù)文本描述生成美觀且高分辨率的視頻,在人工評估中,其性能優(yōu)于上面提到的一些明星文生視頻產(chǎn)品。
論文標(biāo)題:MagicVideo-V2: Multi-Stage High-Aesthetic Video Generation
論文鏈接:https://arxiv.org/pdf/2401.04468.pdf
先來看看效果到底如何~更多示例與對比高清視頻可在官方發(fā)布的鏈接中找到:https://magicvideov2.github.io/
模型結(jié)構(gòu)如圖所示,
原文鏈接:字節(jié)最新文生視頻模型,引發(fā)圍觀!狐貍跳舞超絲滑,效果超Gen-2
聯(lián)系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:更快的AI前沿,更深的行業(yè)洞見。聚集25萬AI應(yīng)用開發(fā)者、算法工程師和研究人員。一線作者均來自清北、國外頂級AI實(shí)驗(yàn)室和互聯(lián)網(wǎng)大廠,兼?zhèn)涿襟wsense與技術(shù)深度。