一個比Sora更懂物理世界的世界模型。
原標題:昆侖萬維發布中國首款“空間智能大模型”,融合3D世界和可交互視頻生成|甲子光年
文章來源:甲子光年
內容字數:6893字
昆侖萬維發布空間智能大模型Matrix-Zero:開啟3D AIGC新紀元
本文總結了昆侖萬維近期發布的空間智能大模型Matrix-Zero的相關信息,并探討了空間智能領域的意義和發展前景。
1. 空間智能:下一代AI浪潮
當前,AI生成內容主要集中在2D領域,例如圖像和視頻。然而,空間智能,即AI生成可交互3D場景,正成為一個新的突破口。它能夠生成更真實、更可控的3D內容,改變電影、游戲、模擬器等行業的制作方式。李飛飛教授將空間智能總結為“我看、我動、我思,故我在”,強調了視覺、和認知的融合。空間智能的發展曾面臨挑戰,但近年來生成式AI的爆發使其技術日趨成熟。
2. Matrix-Zero:3D場景生成與可交互視頻的融合
昆侖萬維發布的Matrix-Zero是一個具有兩大特色的空間智能大模型:一是3D場景生成大模型,支持將圖片轉化為可探索的3D場景,并具備“全局一致性”;二是可交互視頻生成大模型,允許用戶通過交互操作控制視頻內容。與其他3D AIGC工具相比,Matrix-Zero在探索范圍和交互性方面具有顯著優勢。World Labs的模型僅支持小范圍移動,而Matrix-Zero支持任意方向的長距離、大范圍探索,包括環視、360度俯視等。此外,Matrix-Zero生成的3D場景還包含符合物理規律的動態物體,例如光照效果、水花動態等。
3. Matrix-Zero的技術優勢與創新
Matrix-Zero的3D場景生成大模型包含場景布局生成模塊和紋理生成模塊,通過可微渲染和擴散模型生成一致的3D布局和紋理。其可交互視頻生成模型則包含基礎視頻生成模型和用戶輸入交互系統,能夠精確控制視頻中的視角移動,并響應用戶的實時交互操作。這與基于提示詞的圖像生成視頻以及單純的3D場景生成路線有所不同,實現了更精準的控制和更豐富的交互體驗。
4. 昆侖萬維的空間智能戰略布局
昆侖萬維在AI領域進行了全產業鏈布局,涵蓋算力基礎設施、大模型算法和AI應用。該公司已發布多個AI模型,包括文本大模型、音樂大模型和推理大模型等。Matrix-Zero的發布是其在空間智能領域的重要一步,也為其AI矩陣業務帶來了新的助力。昆侖萬維成為國內首家發布3D場景生成和可交互視頻生成模型的企業,展現了其在技術創新和前瞻布局方面的實力。
5. 未來展望
Matrix-Zero的發布標志著空間智能時代的到來。這項技術將對游戲開發、具身智能等行業產生深遠的影響。昆侖萬維在空間智能領域的探索,為未來AI發展提供了新的方向,也預示著更逼真、更沉浸式的數字世界即將到來。
聯系作者
文章來源:甲子光年
作者微信:
作者簡介:甲子光年是一家科技智庫,包含智庫、社群、企業服務版塊,立足中國科技創新前沿陣地,動態跟蹤頭部科技企業發展和傳統產業技術升級案例,推動人工智能、大數據、物聯網、云計算、新能源、新材料、信息安全、大健康等科技創新在產業中的應用與落地。