通研院和北大最新研究成果講解:三維世界中的具身通用智能體LEO |講座預告
AIGC動態(tài)歡迎閱讀
原標題:通研院和北大最新研究成果講解:三維世界中的具身通用智能體LEO |講座預告
關鍵字:智能,機器人,猩猩,講座,北京大學
文章來源:算法邦
內容字數(shù):2905字
內容摘要:
「智猩猩機器人新青年講座」由AI與硬科技知識分享社區(qū)「智猩猩」于今年全新企劃,旨在邀請全球知名高校、頂尖研究機構以及優(yōu)秀企業(yè)的青年學者,主講在具身智能、強化學習、多智能體系統(tǒng)、建模仿真等機器人關鍵前沿技術上的研究成果和開發(fā)實踐。
目前講座已完結兩講,錯過直播的朋友,可以點擊文章底部“閱讀原文”觀看回放!近年來,以DeepMind的Gato為代表的智能體以及以GPT-4V、LLaVA等為代表的多模態(tài)大語言模型在自然語言處理、視覺理解、機器人等任務上取得了顯著的成果。
但是這類模型普遍基于二維圖片文本數(shù)據(jù)訓練得到,無法理解人類所處的三維物理世界,并缺乏與三維世界的交互能力。而想要實現(xiàn)通用人工智能,必須要構建一個能夠理解人類生活的物理世界,并能夠自主實現(xiàn)大量任務,具有情感和價值判斷的智能體。為解決當前問題,北京通用人工智能研究院聯(lián)合北京大學、卡內基梅隆大學和清華大學的研究人員提出了首個精通3D任務的具身智能體LEO。具身智能體LEO以大語言模型為基礎,具備強大的三維場景感知能力及優(yōu)秀的視覺-語言-動作(VLA)能力,能夠完成包括問答(3D QA)、描述(3D captioning)、具身推理
原文鏈接:通研院和北大最新研究成果講解:三維世界中的具身通用智能體LEO |講座預告
聯(lián)系作者
文章來源:算法邦
作者微信:allplusai
作者簡介:智猩猩矩陣賬號之一,連接AI新青年,講解研究成果,分享系統(tǒng)思考。