華為諾亞的盤古Agent來了，讓智能體學會結構化推理

AIGC動態2年前 (2023)發布機器之心

AIGC動態歡迎閱讀

原標題：華為諾亞的盤古Agent來了，讓智能體學會結構化推理
關鍵字：函數,智能,任務,盤古,研究者
文章來源：機器之心
內容字數：10412字

內容摘要：

機器之心報道
編輯：澤南、蛋醬有結構化推理和先驗知識，智能體變得更加通用了。自 AI 誕生以來，開發能夠解決和適應復雜工作的多任務智能體（Agent）一直是個重要的目標。
AI 智能體對于許多應用至關重要，研究者通常用強化學習方法通過環境交互來培養智能體的決策技能。基于模型和無模型的深度強化學習方法都已取得了廣為人們所知的成就，例如 AlphaZero、改進的排序和乘法算法、無人機競速以及聚變反應堆中的等離子體控制。這些成功涉及一個標準的強化學習管道，智能體在其中學習我們所說的外在功能 —— 一種直接與外界交互的策略，即響應環境以最大化獎勵信號。該函數通常是參數化神經網絡，根據環境觀察生成動作。
經典的強化學習方法使用單個映射函數來定義策略 π，但在復雜的環境中通常被證明是不夠的，這與通用智能體在多個隨機環境中交互、適應和學習的目標相矛盾。
在強化學習中引入的先驗通常是特定于任務的，并且需要廣泛的工程和領域專業知識。為了泛化，最近的研究已轉向將大型語言模型（LLM）集成到智能體框架中，如 AutoGen、AutoGPT 和 AgentVerse 等工作。
近日，來自華為諾亞方舟實驗

原文鏈接：華為諾亞的盤古Agent來了，讓智能體學會結構化推理