AIGC動態歡迎閱讀
原標題:14秒就能重建視頻,還能變換角色,Meta讓視頻合成提速44倍
關鍵字:模型,特征,注意力,研究者,編輯
文章來源:機器之心
內容字數:3895字
內容摘要:
機器之心報道
機器之心編輯部Meta的視頻合成新框架又給了我們一點小小的震撼。就今天的人工智能發展水平來說,文生圖、圖生視頻、圖像/視頻風格遷移都已經不算什么難事。
生成式 AI 天賦異稟,能夠毫不費力地創建或修改內容。尤其是圖像編輯,在以十億規模數據集為基礎預訓練的文本到圖像擴散模型的推動下,經歷了重大發展。這股浪潮催生了大量圖像編輯和內容創建應用。
基于圖像的生成模型所取得的成就基礎上,下一個挑戰的領域必然是為其增加「時間維度」,從而實現輕松而富有創意的視頻編輯。
一種直接策略是使用圖像模型逐幀處理視頻,然而,生成式圖像編輯本身就具有高變異性—即使根據相同的文本提示,也存在無數種編輯給定圖像的方法。如果每一幀都編輯,很難保持時間上的一致性。
在最近的一篇論文中,來自Meta GenAI團隊的研究者提出了 Fairy——通過對圖像編輯擴散模型進行「簡單的改編」,大大增強了AI在視頻編輯上的表現。
以下是Fairy的編輯視頻效果展示:Fairy 生成 120 幀 512×384 視頻(4 秒時長,30 FPS)的時間僅為 14 秒,比之前的方法至少快 44 倍。一項涉及 1000
原文鏈接:14秒就能重建視頻,還能變換角色,Meta讓視頻合成提速44倍
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...