AIGC動態歡迎閱讀
原標題:通用世界模型問世:不學習就能生成新領域視頻,可實時控制
關鍵字:模型,視頻,世界,動作,領域
文章來源:機器之心
內容字數:5894字
內容摘要:
機器之心報道
編輯:小舟、澤南這才是 AI 視頻生成的未來?
隨著 OpenAI 今年 2 月發布 Sora,世界模型(World Model)再次成為了 AI 領域的熱門。
世界模型,即通過預測未來的范式對數字世界和物理世界進行理解,一直以來被認為是通往通用人工智能(AGI)的關鍵路徑之一,與當前大模型推崇的智能體(Agent)方向互相區分。
世界模型的研究促進了交互式內容的創建,并為有根據的、長期的推理提供了基礎。當前的基礎模型并不能完全滿足通用世界模型的功能——大型語言模型(LLM)受到對語言模態的依賴以及對物理世界有限理解的限制,而視頻模型(如 Sora)則缺乏對世界模擬的交互式動作控制。
在 UC San Diego、穆罕默德?本?扎耶德人工智能大學(MBZUAI)等機構的最新研究中,人們通過引入 Pandora 向構建通用世界模型邁出了一步。
MBZUAI 校長邢波(Eric Xing)表示,Pandora 是一個可通過語言命令實時操控的世界模型,能夠在視覺空間中實時推理概念層面。是時候超越語言世界中的 LLM,進入物理和感官世界了!
Pandora 是一種混合自回歸擴散模
原文鏈接:通用世界模型問世:不學習就能生成新領域視頻,可實時控制
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...