AIGC動態歡迎閱讀
原標題:微軟新作「Mora」,復原了Sora
關鍵字:視頻,圖像,文本,模型,智能
文章來源:夕小瑤科技說
內容字數:11102字
內容摘要:
夕小瑤科技說 分享來源 | 新智元微軟版Sora誕生了!
Sora雖爆火但閉源,給學術界帶來了不小的挑戰。學者們只能嘗試使用逆向工程來對Sora復現或擴展。盡管提出了Diffusion Transformer和空間patch策略,但想要達到Sora的性能還是很難,何況還缺乏算力和數據集。不過,研究者發起的新一波復現Sora的沖鋒,這不就來了么!就在剛剛,理海大手微軟團隊一種新型的多AI智能體框架———Mora。
論文地址:https://arxiv.org/abs/2403.13248
沒錯,理海大學和微軟的思路,是靠AI智能體。Mora更像是Sora的通才視頻生成。通過整合多個SOTA的視覺AI智能體,來復現Sora展示的通用視頻生成能力。
具體來說,Mora能夠利用多個視覺智能體,在多種任務中成功模擬Sora的視頻生成能力,包括:
– 文本到視頻生成
– 基于文本條件的圖像到視頻生成
– 擴展已生成視頻
– 視頻到視頻編輯
– 拼接視頻
– 模擬數字世界實驗結果表明,Mora在這些任務中取得了接近Sora的表現。值得一提的是,它在文本到視頻生成任務中的表現超越了現有的開源模型,
原文鏈接:微軟新作「Mora」,復原了Sora
聯系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:更快的AI前沿,更深的行業洞見。聚集25萬AI一線開發者、互聯網中高管和機構投資人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備行業嗅覺與報道深度。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...