今日arXiv最熱NLP大模型論文：面向不確定性感知的Language Agent

AIGC動態1年前 (2024)發布夕小瑤科技說

AIGC動態歡迎閱讀

原標題：今日arXiv最熱NLP大模型論文：面向不確定性感知的Language Agent
關鍵字：不確定性,工具,方法,任務,數據
文章來源：夕小瑤科技說
內容字數：7776字

內容摘要：

夕小瑤科技說原創作者 | UALA
引言：面向不確定性的感知的Language AgentLanguage Agent利用大型語言模型（如OpenAI發布的GPT系列、Meta的LLaMA2等）來與外部世界互動，例如通過工具和API收集觀察結果，并處理這些信息以解決任務。這些Language Agent在改進先前具有挑戰性的推理任務方面取得了顯著進展，它們能夠自主地從世界中獲取新知識，并通過記憶或自我完善機制迭代地改進其推理路徑。然而，當前的Language Agent設計主要將LLM視為觀察和知識收集的規劃者、協調者或聚合器，而忽視了在與外部世界交互時處理不確定性的能力。實際上，大量的研究工作已經集中在探索預訓練語言模型中編碼的知識類型，以及如何通過生成性任務（如機器翻譯、摘要和數據到文本生成）來估計這些模型的不確定性。
我們的工作旨在通過集成不確定性估計來改進Language Agent的設計，以便更有效地管理與外部工具的互動。具體來說，我們的框架通過在決策過程中量化不確定性，來判斷何時依賴LLM內部的隱含知識，何時尋求外部資源的幫助。這種方法旨在提高Language Agent

原文鏈接：今日arXiv最熱NLP大模型論文：面向不確定性感知的Language Agent

聯系作者

文章來源：夕小瑤科技說
作者微信：xixiaoyaoQAQ
作者簡介：專業、有趣、深度價值導向的科技媒體。聚集30萬AI工程師、研究員，覆蓋500多家海內外機構投資人，互聯網大廠中高管和AI公司創始人。一線作者來自清北、國內外頂級AI實驗室和大廠，兼備敏銳的行業嗅覺和洞察深度。商務合作：zym5189

閱讀原文