AIGC動態歡迎閱讀
原標題:AI首次實時生成視頻!尤洋團隊新作,網友:這是新紀元
關鍵字:注意力,視頻,團隊,差異,步驟
文章來源:量子位
內容字數:0字
內容摘要:
一水 發自 凹非寺量子位 | 公眾號 QbitAI尤洋團隊新作,首個基于DiT的實時視頻生成方法來了!
先來直觀感受一下效果(右側為新方法):
這是團隊在Open-Sora上,使用5個4s(192幀)480p分辨率視頻進行的測試。
新方法名為Pyramid Attention Broadcast(PAB),由新加坡國立大學尤洋以及3位學生推出。
具體來說,PAB通過減少冗余注意力計算,可實現高達21.6FPS和10.6倍加速,并且不會犧牲基于DiT的流行視頻生成模型(包括Open-Sora、Open-Sora-Plan和Latte)的質量。
作為一種免訓練方法,PAB可為將來任何基于DiT的視頻生成模型提供實時功能。
看完效果對比,網友們紛紛驚嘆:
這將是新紀元。
也引來了眾多專業人士的轉發和點評,如MIT博士Yilun Du表示:
是一個展示了如何將視頻生成加速到實時速度的酷炫工作!可能會為視頻策略和模擬的現實世界用例開辟新的領域。
那么,新方法具體如何實時生成視頻這個難題的呢?
減少冗余注意力計算一開始,團隊比較了當前擴散步驟與前一步驟的注意力輸出差異。
這些差異通過均方誤差(
原文鏈接:AI首次實時生成視頻!尤洋團隊新作,網友:這是新紀元
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...