
AIGC動態歡迎閱讀
原標題:GPT-4/Gemini大翻車,做旅行攻略成功率≈0%!復旦OSU等華人團隊:Agent不會復雜任務規劃
關鍵字:智能,計劃,研究者,工具,信息
文章來源:新智元
內容字數:12312字
內容摘要:
新智元報道編輯:編輯部
【新智元導讀】最近,復旦、俄亥俄州立大學、Meta和賓夕法尼亞州立大學的研究者發現,GPT-4 Agent規劃旅行只有0.6%成功率!離在人類復雜環境中做出規劃,智能體還任重道遠。AI智能體,是目前學界炙手可熱的前沿話題,被眾多專家視為大模型發展的下一個方向。
然而,最近復旦、俄亥俄州立大學、賓夕法尼亞州立大學、Meta AI的研究者們發現,AI智能體在現實世界的規劃能力還很差。
他們對GPT-4 Turbo、Gemini Pro、Mixtral 8x7B等進行了全面評估,發現這些大模型智能體全部翻車了!即使是表現最好的,成功率也僅有0.6%。
對于大模型規劃能力和智能體感興趣的研究人員,以后又有一個新榜可以刷了。(手動狗頭)
項目主頁:https://osu-nlp-group.github.io/TravelPlanner/
看來,讓智能體在現實世界中完成復雜規劃任務的那一天,還遠著呢。
LLM智能體,能規劃旅行嗎規劃,是被視為人類智能的一大特征,它是建立在多種能力之上的進化成果,包括:
– 迭代使用各種工具來收集信息并做決策;
– 為了深入思考而在工作記
原文鏈接:GPT-4/Gemini大翻車,做旅行攻略成功率≈0%!復旦OSU等華人團隊:Agent不會復雜任務規劃
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。

粵公網安備 44011502001135號