今日arXiv最熱NLP大模型論文:面向不確定性感知的Language Agent

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:今日arXiv最熱NLP大模型論文:面向不確定性感知的Language Agent
關(guān)鍵字:不確定性,工具,方法,任務(wù),數(shù)據(jù)
文章來源:夕小瑤科技說
內(nèi)容字?jǐn)?shù):7776字
內(nèi)容摘要:
夕小瑤科技說 原創(chuàng)作者 | UALA
引言:面向不確定性的感知的Language AgentLanguage Agent利用大型語言模型(如OpenAI發(fā)布的GPT系列、Meta的LLaMA2等)來與外部世界互動(dòng),例如通過工具和API收集觀察結(jié)果,并處理這些信息以解決任務(wù)。這些Language Agent在改進(jìn)先前具有挑戰(zhàn)性的推理任務(wù)方面取得了顯著進(jìn)展,它們能夠自主地從世界中獲取新知識(shí),并通過記憶或自我完善機(jī)制迭代地改進(jìn)其推理路徑。然而,當(dāng)前的Language Agent設(shè)計(jì)主要將LLM視為觀察和知識(shí)收集的規(guī)劃者、協(xié)調(diào)者或聚合器,而忽視了在與外部世界交互時(shí)處理不確定性的能力。實(shí)際上,大量的研究工作已經(jīng)集中在探索預(yù)訓(xùn)練語言模型中編碼的知識(shí)類型,以及如何通過生成性任務(wù)(如機(jī)器翻譯、摘要和數(shù)據(jù)到文本生成)來估計(jì)這些模型的不確定性。
我們的工作旨在通過集成不確定性估計(jì)來改進(jìn)Language Agent的設(shè)計(jì),以便更有效地管理與外部工具的互動(dòng)。具體來說,我們的框架通過在決策過程中量化不確定性,來判斷何時(shí)依賴LLM內(nèi)部的隱含知識(shí),何時(shí)尋求外部資源的幫助。這種方法旨在提高Language Agent
原文鏈接:今日arXiv最熱NLP大模型論文:面向不確定性感知的Language Agent
聯(lián)系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡(jiǎn)介:專業(yè)、有趣、深度價(jià)值導(dǎo)向的科技媒體。聚集30萬AI工程師、研究員,覆蓋500多家海內(nèi)外機(jī)構(gòu)投資人,互聯(lián)網(wǎng)大廠中高管和AI公司創(chuàng)始人。一線作者來自清北、國(guó)內(nèi)外頂級(jí)AI實(shí)驗(yàn)室和大廠,兼?zhèn)涿翡J的行業(yè)嗅覺和洞察深度。商務(wù)合作:zym5189

粵公網(wǎng)安備 44011502001135號(hào)