網友:和美劇拍攝一個套路
原標題:AI視頻邊生成邊播放!首幀延遲僅1.3秒,生成速度9.4幀/秒|Adobe&MIT新研究
文章來源:量子位
內容字數:3217字
引言
Adobe與MIT聯合開發的CausVid技術,標志著視頻生成領域的一次重大突破。該技術通過實時生成視頻,改變了傳統的等待模式,使用戶可以在生成過程中即時觀看內容。
1. 傳統視頻生成的挑戰
傳統視頻生成模型通常采用雙向注意力機制,這意味著每一幀生成都需要依賴前后幀的信息。這種方式導致用戶在觀看視頻時,往往需要等待幾分鐘才能看到完整內容,極大影響了用戶體驗。
2. CausVid的創新解決方案
CausVid通過蒸餾預訓練的雙向擴散模型(DiT),實現了自回歸生成模型。這一技術允許在生成首幀后,用戶即可開始觀看視頻,其余幀則在播放過程中動態生成,解決了傳統模型的延遲問題。
3. 提升生成速度與質量
為了進一步提高生成速度,研究團隊采用了分布匹配蒸餾(DMD)技術,將生成步驟從50步縮減至4步,顯著提升了視頻生成的效率與質量。同時,通過非對稱蒸餾策略,CausVid有效減少了自回歸模型中的誤差累積問題。
4. 實驗效果顯著
在實驗中,CausVid的首幀生成延遲從3.5分鐘降至1.3秒,生成速度從0.6幀/秒提升至9.4幀/秒,質量也超越了現有主流模型。研究團隊表示,CausVid能支持多種應用,如圖片動畫化、實時視頻風格轉換和交互式劇情生成。
5. 未來展望
借助CausVid技術,未來視頻生成將更加高效和靈活。該技術能夠在大語言模型中廣泛應用,結合滑動窗口機制,打破了傳統模型在視頻時長上的限制,預示著視頻生成的全新可能性。
結論
CausVid的推出為視頻生成帶來了性的變化,不僅提升了生成速度和質量,更拓展了視頻應用的邊界。隨著開源代碼的發布,預計會有更多開發者和研究者參與到這一領域,推動技術的進一步發展。
聯系作者
文章來源:量子位
作者微信:
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...