浙大發布Agent學習框架，13B 模型達到 ChatGPT 水平！

AIGC動態2年前 (2024)發布夕小瑤科技說

AIGC動態歡迎閱讀

原標題：浙大發布Agent學習框架，13B 模型達到 ChatGPT 水平！
關鍵字：模型,數據,工具,任務,智能
文章來源：夕小瑤科技說
內容字數：6431字

內容摘要：

?夕小瑤科技說原創作者 | 小戲、Python2023 年下半年，AI Agent 正式開啟「大模型下半場」。
自“人工智能”這門學科創立之初，一種可以“觀察世界”-“思考推理”-“做出行動”-“反思學習”的人造代理就是構建通用人工智能的終極目標之一。而基于大模型的 AI Agent 借助大模型強大的推理判斷能力，為 AI Agent 的發展開啟了一扇新的大門。
以 LangChain 的底層思想 ReACT 為例，大模型 Agent 在與外部環境互動時，經歷“思考”-“行動”-“觀察”三個步驟，通過將“行動”與“推理”結合，賦予大模型解決實際問題的能力。
但是，半年過去，直接使用類似 GPT-4 等閉源模型通過 Prompt 的方式構建 Agent 的思路盡管成績斐然，但是不可避免的我們對這類 Agent 的掌控性往往并不高，一些結果不具有可解釋性甚至不可復現。因此，一些工作開始在開源模型的基礎上使用軌跡數據對模型進行微調，以使得 Agent 具備更強的解決問題的能力。
然而，微調這種思路面對著兩大挑戰，首先，微調需要數據，數據不可能完全由人工生成，那么不可避免的 Agent 進行

原文鏈接：浙大發布Agent學習框架，13B 模型達到 ChatGPT 水平！