AAAI 2024:大模型如何掌握復(fù)雜工具?看孔子框架的教學(xué)之道
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:AAAI 2024:大模型如何掌握復(fù)雜工具?看孔子框架的教學(xué)之道
關(guān)鍵字:工具,模型,階段,數(shù)據(jù),實(shí)例
文章來(lái)源:夕小瑤科技說(shuō)
內(nèi)容字?jǐn)?shù):7911字
內(nèi)容摘要:
夕小瑤科技說(shuō) 原創(chuàng)作者 | 智商掉了一地、Python
如今,大型語(yǔ)言模型(LLM)發(fā)展飛速,在文本和圖像生成方面表現(xiàn)都很出色,但在我們的實(shí)際生活中,要理解和正確使用各種工具方面尚存在困難。人們期望這些模型在解決實(shí)際問(wèn)題時(shí)能夠靈活運(yùn)用和理解各種工具,例如在規(guī)劃路線、智能家居等生活場(chǎng)景中,模型可能需要準(zhǔn)確選擇和使用各種工具。
為了應(yīng)對(duì) LLM 在實(shí)際應(yīng)用場(chǎng)景中使用各種復(fù)雜工具時(shí)面臨的挑戰(zhàn),作者提出了孔子(Confucius)框架,通過(guò)當(dāng)一個(gè)出色的“老師”,使 LLM 在貼近我們生活的應(yīng)用場(chǎng)景中更加智能。通過(guò)多階段學(xué)習(xí)、迭代自指導(dǎo)和反思反饋(ISIF)等策略,該框架使 LLM 能夠更好地掌握各種工具。
▲圖1 現(xiàn)有基于微調(diào)的工具學(xué)習(xí)方法與Confucius 的比較論文題目: Confucius: Iterative Tool Learning from Introspection Feedback by Easy-to-Difficult Curriculum
論文鏈接: https://arxiv.org/abs/2308.14034
工具學(xué)習(xí)(Tool Learning)▲表1 相關(guān)工
原文鏈接:AAAI 2024:大模型如何掌握復(fù)雜工具?看孔子框架的教學(xué)之道
聯(lián)系作者
文章來(lái)源:夕小瑤科技說(shuō)
作者微信:xixiaoyaoQAQ
作者簡(jiǎn)介:更快的AI前沿,更深的行業(yè)洞見(jiàn)。聚集25萬(wàn)AI應(yīng)用開(kāi)發(fā)者、算法工程師和研究人員。一線作者均來(lái)自清北、國(guó)外頂級(jí)AI實(shí)驗(yàn)室和互聯(lián)網(wǎng)大廠,兼?zhèn)涿襟wsense與技術(shù)深度。