任務成功率可達97%
原標題:一次示范讓Agent適應各種新環境,浙大杭電智能體框架入選NeurIPS
文章來源:量子位
內容字數:5702字
研究背景
隨著大語言模型(LLM Agents)在各個領域中的廣泛應用,智能體在執行任務時的自主性和適應性受到關注。然而,現有的智能體往往過度依賴人類專家的知識,難以在新環境中學習和適應。
AutoManual框架的提出
為了解決這一問題,杭州電子科技大學和浙江大學的研究者提出了AutoManual框架。該框架通過模仿人類在新環境中“記筆記”的過程,使智能體能夠通過一次人類示范適應新環境,成功率可達97%。
框架結構
AutoManual框架包含三個主要階段:Building、Formulating和Testing。
- Building階段:Planner Agent與Builder Agent合作,通過與環境互動構建規則。Builder Agent在此階段使用規則系統更新環境規則。
- Formulating階段:Formulator Agent將規則整理成Markdown格式的指導手冊,增強規則的可讀性和理解性。
- Testing階段:使用生成的手冊評估智能體的任務執行效果,確保其能有效指導較小模型。
實驗結果
研究團隊在ALFWorld和MiniWoB++等環境中進行實驗,結果表明,只需一個人類示范,AutoManual就能顯著提高智能體的成功率。在ALFWorld中,智能體成功率達97%,而在MiniWoB++中成功率達到98%。
總結與影響
AutoManual框架有效地減少了對人類專家知識的依賴,通過記錄和更新環境理解,幫助智能體更好地適應新環境。這種方法不僅提升了智能體的自主性,也為其他智能體提供了規劃指導,具有重要的應用前景。
聯系作者
文章來源:量子位
作者微信:
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...