AIGC動態歡迎閱讀
原標題:如何解決智能體探索和利用行為之間的平衡問題?
關鍵字:狀態,結構,動作,作者,智能
文章來源:AI前線
內容字數:0字
內容摘要:
作者|曾祥華 北京航空航天大學 博士生
本文介紹來自北京航空航天大學彭浩老師團隊發表在 NeurlPS 2024 上的一篇文章“Effective Exploration Based on the Structural Information Principles”。為了解決當前基于傳統信息論的探索方法由于忽略狀態 – 動作空間內在結構而導致效率低下的問題,作者提出了一種基于結構信息原理的探索框架,即 SI2E。SI2E 通過定義結構互信息,提出一種新的狀態動作表征原則,捕捉狀態 – 動作對之間的動態關系,構建最優編碼樹。通過分析狀態 – 動作對之間的價值差異,定義策略條件結構熵,構造內在獎勵機制,實現對于狀態 – 動作空間更為有效的覆蓋。在 MiniGrid、MetaWorld 和 DeepMind Control Suite 等測試環境中,SI2E 在最終性能與采樣效率等方面的表現遙遙領先,最大提升幅度分別達到了 37.63% 和 60.25%。
論文名稱:Effective Exploration Based on the Structural Information Princ
聯系作者
文章來源:AI前線
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...