AIGC動態歡迎閱讀
原標題:浙大發布Agent學習框架,13B 模型達到 ChatGPT 水平!
關鍵字:模型,數據,工具,任務,智能
文章來源:夕小瑤科技說
內容字數:6431字
內容摘要:
?夕小瑤科技說 原創作者 | 小戲、Python2023 年下半年,AI Agent 正式開啟「大模型下半場」。
自“人工智能”這門學科創立之初,一種可以“觀察世界”-“思考推理”-“做出行動”-“反思學習”的人造代理就是構建通用人工智能的終極目標之一。而基于大模型的 AI Agent 借助大模型強大的推理判斷能力,為 AI Agent 的發展開啟了一扇新的大門。
以 LangChain 的底層思想 ReACT 為例,大模型 Agent 在與外部環境互動時,經歷“思考”-“行動”-“觀察”三個步驟,通過將“行動”與“推理”結合,賦予大模型解決實際問題的能力。
但是,半年過去,直接使用類似 GPT-4 等閉源模型通過 Prompt 的方式構建 Agent 的思路盡管成績斐然,但是不可避免的我們對這類 Agent 的掌控性往往并不高,一些結果不具有可解釋性甚至不可復現。因此,一些工作開始在開源模型的基礎上使用軌跡數據對模型進行微調,以使得 Agent 具備更強的解決問題的能力。
然而,微調這種思路面對著兩大挑戰,首先,微調需要數據,數據不可能完全由人工生成,那么不可避免的 Agent 進行
原文鏈接:浙大發布Agent學習框架,13B 模型達到 ChatGPT 水平!
聯系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:更快的AI前沿,更深的行業洞見。聚集25萬AI應用開發者、算法工程師和研究人員。一線作者均來自清北、國外頂級AI實驗室和互聯網大廠,兼備媒體sense與技術深度。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...