AIGC動態歡迎閱讀
原標題:史上首個實時AI視頻生成技術:DiT通用,速度提升10.6倍
關鍵字:注意力,視頻,模型,方法,步驟
文章來源:機器之心
內容字數:0字
內容摘要:
機器之心報道
機器之心編輯部DiT 都能用,生成視頻無質量損失,也不需要訓練。實時 AI 視頻生成來了!
本周三,新加坡國立大學尤洋團隊提出了業內第一種可以實時輸出的,基于 DiT 的視頻生成方法。該技術名為 Pyramid Attention Broadcast (PAB)。通過減少冗余注意力計算,PAB 實現了高達 21.6 FPS 的幀率和 10.6 倍的加速,同時不會犧牲包括 Open-Sora、Open-Sora-Plan 和 Latte 在內的流行基于 DiT 的視頻生成模型的質量。值得注意的是,作為一種不需要訓練的方法,PAB 可以為任何未來基于 DiT 的視頻生成模型提供加速,讓其具備實時生成的能力。
自今年起,OpenAI 的 Sora 和其他基于 DiT 的視頻生成模型引起了 AI 領域的又一波浪潮。然而與圖像生成相比,人們對于視頻生成的關注點基本都在于質量,很少有研究專注于探索如何加速 DiT 模型推理。加速視頻生成模型的推理對于生成式 AI 應用來說已經是當務之急。
PAB 方法的出現,為我們打開了一條路。原始方法與 PAB 視頻生成速度的比較。作者在 Open
原文鏈接:史上首個實時AI視頻生成技術:DiT通用,速度提升10.6倍
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...