復刻Sora的通用視頻生成能力，開源多智能體框架Mora來了

AIGC動態2年前 (2024)發布機器之心

AIGC動態歡迎閱讀

原標題：復刻Sora的通用視頻生成能力，開源多智能體框架Mora來了
關鍵字：視頻,圖像,智能,文本,任務
文章來源：機器之心
內容字數：8166字

內容摘要：

機器之心專欄
機器之心編輯部何愷明的目標是：探索面向復雜世界的智能。Sora 是首個引起社會廣泛關注的大規模通用視頻生成模型。自 OpenAI 在 2024 年 2 月推出以來，沒有其他視頻生成模型能夠在性能或支持廣泛視頻生成任務的能力上與 Sora 匹敵。此外，完全公開的視頻生成模型寥寥無幾，大多數都是閉源的。
為了彌補這一差距，來自理海大學、微軟研究院的研究者提出了一種多智能體框架Mora，該框架整合了幾種先進的視覺 AI 智能體，以復制 Sora 所展示的通用視頻生成能力。特別是，Mora 能夠利用多個視覺智能體，在各種任務中成功模仿 Sora 的視頻生成能力，例如（1）文本到視頻生成，（2）文本條件下的圖像到視頻生成，（3）擴展生成的視頻，（4）視頻到視頻編輯，（5）連接視頻以及（6）模擬數字世界。廣泛的實驗結果表明，Mora 在各種任務中達到了接近 Sora 的性能。然而，當從整體上評估時，Mora與 Sora 之間存在明顯的性能差距。總之，研究團隊希望這個項目能夠指導視頻生成的未來軌跡，通過協作的 AI 智能體實現。論文鏈接：https://arxiv.org/abs/24

原文鏈接：復刻Sora的通用視頻生成能力，開源多智能體框架Mora來了