AIGC動態歡迎閱讀
原標題:今日arXiv最熱大模型論文:港大&微軟發布AgentGen提高大模型規劃能力,8B模型接近GPT-4水平
關鍵字:任務,環境,模型,能力,目標
文章來源:夕小瑤科技說
內容字數:0字
內容摘要:
夕小瑤科技說 原創作者 | Richard在大語言模型(LLM)問世之后,基于 LLM 的 Agent 引起了廣泛的關注并且變得越來越流行。規劃能力無論對人類還是 Agent 都是一個重要的決策步驟,規劃的本質是通過預先設定的行動過程,以期望在未來達到特定的目標或者解決特定的問題。
規劃是基于 LLM 的 Agent 一個關鍵的能力,涉及從初始狀態達到預期目標的系統性過程。規劃決定了 Agent 如何在復雜環境中自主操作,其中包括與環境交互、執行動作、考慮約束條件和可用資源等。
最近關于 Agent 訓練的最新研究表明,通過使用軌跡數據(動作-觀察對)序列對大模型進行微調可以增強其規劃的能力。但是目前的工作主要集中于手動設計的規劃任務和環境中的合成軌跡。
鑒于此,港大聯合微軟提出 AgentGen 框架,對自動合成多樣化環境和從簡單到困難的漸進規劃任務進行探索。AgentGen 框架利用 LLM 生成多樣化環境和規劃任務,采用基于啟發式規則構建的語料庫和 BO-EVOL 方法提升任務難度多樣性。
AgentGen 極大提高了 LLM 的規劃能力,AgentGen指令微調的 Llama-
原文鏈接:今日arXiv最熱大模型論文:港大&微軟發布AgentGen提高大模型規劃能力,8B模型接近GPT-4水平
聯系作者
文章來源:夕小瑤科技說
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...