AIGC動態歡迎閱讀
原標題:今日arXiv最熱NLP大模型論文:面向不確定性感知的Language Agent
關鍵字:不確定性,工具,方法,任務,數據
文章來源:夕小瑤科技說
內容字數:7776字
內容摘要:
夕小瑤科技說 原創作者 | UALA
引言:面向不確定性的感知的Language AgentLanguage Agent利用大型語言模型(如OpenAI發布的GPT系列、Meta的LLaMA2等)來與外部世界互動,例如通過工具和API收集觀察結果,并處理這些信息以解決任務。這些Language Agent在改進先前具有挑戰性的推理任務方面取得了顯著進展,它們能夠自主地從世界中獲取新知識,并通過記憶或自我完善機制迭代地改進其推理路徑。然而,當前的Language Agent設計主要將LLM視為觀察和知識收集的規劃者、協調者或聚合器,而忽視了在與外部世界交互時處理不確定性的能力。實際上,大量的研究工作已經集中在探索預訓練語言模型中編碼的知識類型,以及如何通過生成性任務(如機器翻譯、摘要和數據到文本生成)來估計這些模型的不確定性。
我們的工作旨在通過集成不確定性估計來改進Language Agent的設計,以便更有效地管理與外部工具的互動。具體來說,我們的框架通過在決策過程中量化不確定性,來判斷何時依賴LLM內部的隱含知識,何時尋求外部資源的幫助。這種方法旨在提高Language Agent
原文鏈接:今日arXiv最熱NLP大模型論文:面向不確定性感知的Language Agent
聯系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:專業、有趣、深度價值導向的科技媒體。聚集30萬AI工程師、研究員,覆蓋500多家海內外機構投資人,互聯網大廠中高管和AI公司創始人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備敏銳的行業嗅覺和洞察深度。商務合作:zym5189