AI Agent 落地現狀:成功率太低,即使用 GPT-4 也不到 15%
AIGC動態歡迎閱讀
原標題:AI Agent 落地現狀:成功率太低,即使用 GPT-4 也不到 15%
關鍵字:智能,任務,上下文,模型,步驟
文章來源:Founder Park
內容字數:0字
內容摘要:
文章轉載自「機器之心」,Founder Park 略有增刪。
隨著大語言模型的不斷進化與自我革新,性能、準確度、穩定性都有了大幅的提升,這已經被各個基準問題集驗證過了。但是,對于現有版本的 LLM 來說,它們的綜合能力似乎并不能完全支撐得起 AI 智能體。
多模態、多任務、多領域儼然已成為 AI 智能體在大眾認知里的必須要求,但是在具體的功能實踐中所展現的真實效果卻差強人意,這似乎也再次提醒各個 AI 智能體初創公司以及大型科技巨頭認清現實:腳踏實地一點,先別把攤子鋪得太大,從 AI 增強功能開始做起。
最近,一篇討論 AI 智能體在宣傳和真實表現上的差距的博客中,強調了一個觀點:「AI 智能體在宣傳上是個巨人,而現實卻很不妙。」
不可否認的是,自主 AI 智能體能夠執行復雜任務的前景已經引起極大的興奮。通過與外部工具和功能的交互,LLMs 可以在沒有人為干預的情況下完成多步驟的工作流程。
但現實證明,這比預期的要更具挑戰性。
WebArena 排行榜(一個真實可復現的網絡環境,用于評估實用智能體的性能)對 LLM 智能體在現實任務中的表現進行了基準測試,結果顯示即使是表現最好的模型,
原文鏈接:AI Agent 落地現狀:成功率太低,即使用 GPT-4 也不到 15%
聯系作者
文章來源:Founder Park
作者微信:Founder-Park
作者簡介:來自極客公園,專注與科技創業者聊「真問題」。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...