AIGC動態歡迎閱讀
原標題:首個精通3D任務的具身通才智能體:感知、推理、規劃、行動統統拿下
文章來源:機器之心
內容字數:9434字
內容摘要:機器之心專欄機器之心編輯部想要邁向通用人工智能,必須要構建一個能夠理解人類生活的真實世界,并掌握豐富技能的具身通用智能體。今年以來,以 GPT-4 (V)[1]、LLaVA [2]、PALM-E [3] 等為代表的多模態大語言模型(Multi-modal Large Language Model)在自然語言處理、視覺理解、機器人等任務上取得了顯著的成功,但這類模型都是基于二維圖片文本數據訓練得到,在理解三維世界和與三維世界交互方面能力欠缺。為解決這一問題,北京通用人工智能研究院聯合北京大學、梅隆大學和清華大學的研究人員提出了首個三維世界中的具身多任務多模態的通才智能體 LEO。論文鏈接:https://arxiv.org/abs/2311.12871項目主頁:https://embodied-generalist.github.io/代碼鏈接:https://github.com/e…
原文鏈接:點此閱讀原文:首個精通3D任務的具身通才智能體:感知、推理、規劃、行動統統拿下
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...