AIGC動態歡迎閱讀
原標題:阿里發“神筆馬良版Sora”,輕輕一抹讓貓咪轉向,20個演示視頻+10頁技術報告解讀
關鍵字:視頻,軌跡,阿里,模型,圖像
文章來源:智東西
內容字數:0字
內容摘要:
視頻生成告別“抽卡”。
作者|香草
編輯|李水青
AI視頻生成賽道風起云涌,國內外新穎的文生、圖生視頻產品層出不窮。在各大廠商的“內卷”之下,當下的視頻生成模型各方面已經接近“以假亂真”的效果。
但與此同時,大部分視頻生成模型的準確程度、遵循指令的能力還有待提升,生成視頻仍然是一個“抽卡”的過程,往往需要用戶生成許多次,才能獲得符合需求的結果。這也造成算力成本過高、資源浪費等問題。
如何提升視頻生成的精準度,減少“抽卡”次數,利用盡可能少的資源來獲取符合需求的視頻?
智東西8月3日報道,阿里團隊近日推出視頻生成模型Tora,能夠根據軌跡、圖像、文本或其組合,簡單幾筆快速生成精確控制的視頻,同時也支持首尾幀控制,讓視頻生成的可控性又上了一個階梯。Tora是首個面向軌跡的DiT框架模型,利用DiT的可擴展性,Tora生成的物體不僅能精確地遵循軌跡,而且可以有效地模擬物理世界動態,相關論文已于8月1日發布在arXiv上。
▲Tora論文
Tora目前僅提供視頻演示,其項目主頁顯示,其后續將發布在線Demo和推理、訓練代碼。
論文地址:
https://arxiv.org/abs/24
原文鏈接:阿里發“神筆馬良版Sora”,輕輕一抹讓貓咪轉向,20個演示視頻+10頁技術報告解讀
聯系作者
文章來源:智東西
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...