智能體首次達到Kaggle Grandmaster水平,華為用結(jié)構(gòu)化推理補齊思維鏈短板
AIGC動態(tài)歡迎閱讀
原標(biāo)題:智能體首次達到Kaggle Grandmaster水平,華為用結(jié)構(gòu)化推理補齊思維鏈短板
關(guān)鍵字:華為,數(shù)據(jù),任務(wù),科學(xué),智能
文章來源:機器之心
內(nèi)容字數(shù):0字
內(nèi)容摘要:
機器之心報道
編輯:Panda前些時日,AI 大模型開始掌握操作計算機的能力,但整體而言,它們與物理世界互動的能力仍處于早期階段。
為了提高 LLM 在復(fù)雜的現(xiàn)實世界中的表現(xiàn),研究者們提出了各種提示策略來提升大模型的推理和規(guī)劃能力,比如思維鏈、思維樹和思維圖譜。這些進步與工具集成一起,推動著通用 AI 智能體的發(fā)展,讓它們現(xiàn)在已經(jīng)能夠用 LLM 輸出的決策策略來解決序列決策問題(不過依然還相對簡單)。
在現(xiàn)實世界中,一個難題的解決方案往往都不是孤立存在的,而需要系統(tǒng)性的方法。這就促使人們開始研究如何讓 LLM 通過順序或并行模塊處理智能體任務(wù),從而動態(tài)地、分步驟地解決問題。
近日,華為諾亞方舟實驗室、倫敦大學(xué)學(xué)院(UCL)和達姆施塔特工業(yè)大學(xué)的一個研究團隊在這個研究方向上做出了自己的貢獻。他們采用第一性原理方法,將數(shù)據(jù)的分析、處理和預(yù)測(即數(shù)據(jù)科學(xué))作為 LLM 與現(xiàn)實世界環(huán)境和外部系統(tǒng)交互的核心和可遷移技能,得到了一種利用 LLM 解決系統(tǒng)數(shù)據(jù)科學(xué)任務(wù)復(fù)雜性的新方法。然后他們基于此開發(fā)了智能體 Agent K v1.0,并讓其參加了多模態(tài) Kaggle 競賽。最終 Agent K v
原文鏈接:智能體首次達到Kaggle Grandmaster水平,華為用結(jié)構(gòu)化推理補齊思維鏈短板
聯(lián)系作者
文章來源:機器之心
作者微信:
作者簡介: