Agent 交互新體驗!
原標題:被 AutoGLM 秀一臉,這才是 Agent 該有的樣子
文章來源:特工宇宙
內容字數:3744字
AI Agent的崛起:智譜AutoGLM的全新體驗
近年來,AI Agent的概念逐漸深入人心,但具體的定義卻仍顯模糊。我們曾多次討論Agent的含義,其中,Langchain提出的定義尤為引人注目:Agent是利用大語言模型(LLM)來決定應用的控制流系統。與傳統的AI助手相比,Agent不僅能響應用戶的詢問,還能根據用戶需求主動進行反思、規劃和執行任務。今天,智譜在其“Agent互動新體驗”OpenDay上發布的升級版AutoGLM,正是這一概念的生動體現。
AutoGLM的智能進化
AutoGLM是智譜在上個月推出的“住在手機里的AI管家”,它基于自研的“基礎智能體解耦合中間界面”和“自進化在線課程強化學習框架”,成為第一個產品化的AI Agent。用戶可以通過文字或語音指令,讓AI Agent模擬人類操作手機,實現從表達到執行的轉變。
在經過一個月的優化后,智譜對AutoGLM進行了全面升級,帶來了更智能的使用體驗。這次升級主要包括以下幾個方面:
- 復雜步驟與循環操作:能夠自主執行超過50步的無打斷操作,同時支持操作流程的復現。
- 跨App操作:具備更強的泛化能力,支持復雜任務在不同應用間的操作。
- 記憶與快捷指令:在用戶授權下,AutoGLM能記住過往選擇,并在特定指令觸發時自動行動。
- AI主動決策:對于模糊的用戶指令,能夠主動幫助用戶做出決策。
便捷的生活助手
想象一下,用戶在享受休閑時光時,只需口頭提要求,AI就能控制手機完成各種任務。這種便捷的體驗讓人十分興奮。我第一時間申請了內測,并對AutoGLM進行了測試。
例如,當我在看電視時遇到不熟悉的網紅或梗,只需命令AutoGLM幫我打開某音關注相關內容。又比如,我可以讓它打開某團,方便我快速點常吃的燒烤,節省寶貴的時間。此外,想在淘寶上購買鍵盤,只需簡單的語音指令,AI就能直達購買頁面,避免繁瑣的廣告干擾。
強大的功能與應用
除了上述功能,AutoGLM還具備更多能力。它通過自然語言指令,實現復雜任務的快速執行,體現了AI Agent強大的任務規劃能力和屏幕界面信息理解能力。在實際使用中,用戶可能會遇到意想不到的情況,此時Agent可以運用判斷與自我糾錯能力,并與用戶持續互動,精準完成操作。
智譜還推出了AutoGLM-Web,能夠幫助用戶在網頁上進行站內檢索和多鏈接總結,進一步提升工作效率。此外,量子速讀和量子速寫等實用工具,使得用戶在各大平臺上進行信息獲取和內容創作變得更加高效。
展望未來:智能化的全新生態
智譜還推出了GLM-PC,這是一款可以操作PC的桌面應用。用戶僅需一句話即可快速執行復雜任務,充分展現了基于CogAgent模型的視覺理解和任務規劃能力。隨著科技的不斷發展,AI Agent的形態和功能將不斷演進,未來將實現更高層次的自我學習能力。
無論是在手機、Web還是PC端,智譜正在構建以大模型為中心的通用計算系統GLM-OS。AutoGLM和CogAgent的目標是模仿人類的Plan-Do-Check-Act循環,實現自我反饋與提升。我們相信,隨著大模型技術的持續推進,AI Agent對人機交互的變革才剛剛開始!
聯系作者
文章來源:特工宇宙
作者微信:
作者簡介:Agent Universe,專注于智能體的AI科技媒體。