AIGC動態歡迎閱讀
原標題:空間智能如何構建?牛津大學博士論文《深度具身智能體的空間推理與規劃》230頁pdf
關鍵字:策略,任務,智能,環境,選項
文章來源:人工智能學家
內容字數:0字
內容摘要:
來源:專知
人類能夠通過規劃、推理和預測行動結果,執行具有長期目標的復雜任務。為了讓具身智能體(如機器人)實現類似的能力,它們必須獲得可以遷移到新情境中的環境知識,并在有限的試錯預算下學習?;趯W習的方法,如深度強化學習,可以從數據中發現并利用應用領域的內在規律和特征,并不斷提高其性能,但這通常需要大量的訓練數據。本論文探討了用于空間推理與規劃任務的數據驅動技術的發展,重點在于提高學習效率、可解釋性以及在新場景中的可遷移性。
本論文的主要貢獻包括四個方面:
CALVIN:一種微分規劃器,能夠學習可解釋的世界模型用于長期規劃。CALVIN成功地在部分可觀測的三維環境中(如迷宮和室內房間)導航,通過從專家示范中學習獎勵(目標和障礙)以及狀態轉換(機器人動力學)。
SOAP:一種強化學習算法,用于無監督地發現長遠任務的宏動作(選項)。選項將任務劃分為子任務,并實現子任務的穩定執行。SOAP在基于歷史條件的走廊任務以及經典基準(如Atari游戲)中表現出穩健的性能。
LangProp:一個使用大型語言模型(LLM)進行代碼優化的框架,通過將代碼視為可學習的策略,解決具身智能體問題。該框架在CA
原文鏈接:空間智能如何構建?牛津大學博士論文《深度具身智能體的空間推理與規劃》230頁pdf
聯系作者
文章來源:人工智能學家
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...