AIGC動態歡迎閱讀
原標題:復刻Sora的通用視頻生成能力,開源多智能體框架Mora來了
關鍵字:視頻,圖像,智能,文本,任務
文章來源:機器之心
內容字數:8166字
內容摘要:
機器之心專欄
機器之心編輯部何愷明的目標是:探索面向復雜世界的智能。Sora 是首個引起社會廣泛關注的大規模通用視頻生成模型。自 OpenAI 在 2024 年 2 月推出以來,沒有其他視頻生成模型能夠在性能或支持廣泛視頻生成任務的能力上與 Sora 匹敵。此外,完全公開的視頻生成模型寥寥無幾,大多數都是閉源的。
為了彌補這一差距,來自理海大學、微軟研究院的研究者提出了一種多智能體框架Mora,該框架整合了幾種先進的視覺 AI 智能體,以復制 Sora 所展示的通用視頻生成能力。特別是,Mora 能夠利用多個視覺智能體,在各種任務中成功模仿 Sora 的視頻生成能力,例如(1)文本到視頻生成,(2)文本條件下的圖像到視頻生成,(3)擴展生成的視頻,(4)視頻到視頻編輯,(5)連接視頻以及(6)模擬數字世界。廣泛的實驗結果表明,Mora 在各種任務中達到了接近 Sora 的性能。然而,當從整體上評估時,Mora與 Sora 之間存在明顯的性能差距。總之,研究團隊希望這個項目能夠指導視頻生成的未來軌跡,通過協作的 AI 智能體實現。論文鏈接:https://arxiv.org/abs/24
原文鏈接:復刻Sora的通用視頻生成能力,開源多智能體框架Mora來了
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章

暫無評論...