不靠更復雜的策略，僅憑和大模型訓練對齊，零樣本零經驗單LLM調用，成為網絡任務智能體新SOTA

AIGC動態歡迎閱讀

原標題：不靠更復雜的策略，僅憑和大模型訓練對齊，零樣本零經驗單LLM調用，成為網絡任務智能體新SOTA
關鍵字：智能,任務,行動,空間,網絡
文章來源：機器之心
內容字數：0字

內容摘要：

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年，機器之心AIxiv專欄接收報道了2000多篇內容，覆蓋全球各大高校與企業的頂級實驗室，有效促進了學術交流與傳播。如果您有優秀的工作想要分享，歡迎投稿或者聯系報道。投稿郵箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com網絡智能體旨在讓一切基于網絡功能的任務自動發生。比如你告訴智能體你的預算，它可以幫你預訂酒店。既擁有海量常識，又能做長期規劃的大語言模型（LLM），自然成為了智能體常用的基礎模塊。
于是上下文學習示例、任務技巧、多智能體協同、強化學習算法…… 一切適用于通用智能體的想法都搶著在大模型落地。
然而有一個問題始終橫亙在LLM 和智能體之間：基于 LLM 的網絡智能體的行動 / 觀測空間與 LLM 訓練數據的空間相去甚遠。
智能體在充斥著具身行為的行動空間（如鼠標懸停、鍵盤組合鍵）和遍布前端功能強化、格式渲染的觀測空間下運作，大語言模型的理解和推理能力能充分發揮作用嗎？尤其是大語言模型的主要訓練任務是文本補全、問答和對齊人類偏好，這一點值得思考。
來自伊利諾伊大學香

原文鏈接：不靠更復雜的策略，僅憑和大模型訓練對齊，零樣本零經驗單LLM調用，成為網絡任務智能體新SOTA