單卡3小時(shí)訓(xùn)練專屬大模型Agent
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:單卡3小時(shí)訓(xùn)練專屬大模型Agent
關(guān)鍵字:模型,知乎,工具,數(shù)據(jù),網(wǎng)頁
文章來源:算法邦
內(nèi)容字?jǐn)?shù):12837字
內(nèi)容摘要:
今天給大家?guī)硪黄狝gent微調(diào)實(shí)戰(zhàn)文章-《單卡 3 小時(shí)訓(xùn)練專屬大模型 Agent:基于 LLaMA Factory 實(shí)戰(zhàn)》,來自知乎@hiyouga。知乎:https://zhuanlan.zhihu.com/p/678989191Github:https://github.com/hiyouga/LLaMA-Factory
Agent(智能體)是當(dāng)今 LLM(大模型)應(yīng)用的熱門話題 [1],通過任務(wù)分解(task planning)、工具調(diào)用(tool using)和多智能體協(xié)作(multi-agent cooperation)等途徑,LLM Agent 有望突破傳統(tǒng)語言模型能力界限,體現(xiàn)出更強(qiáng)的智能水平。在這之中,調(diào)用外部工具解決問題成為 LLM Agent 必不可缺的一項(xiàng)技能,模型根據(jù)用戶問題從工具列表中選擇恰當(dāng)?shù)墓ぞ撸瑫r(shí)生成工具調(diào)用參數(shù),綜合工具返回結(jié)果和上下文信息總結(jié)出答案。通過調(diào)用外部工具,LLM 能夠獲取到實(shí)時(shí)、準(zhǔn)確的知識(shí),大大降低了生成中的幻覺(hallucination)現(xiàn)象,使 LLM 的任務(wù)解決能力得到長足的提升。工具調(diào)用能力的獲得離不開模型微調(diào),盡管使用
原文鏈接:單卡3小時(shí)訓(xùn)練專屬大模型Agent
聯(lián)系作者
文章來源:算法邦
作者微信:allplusai
作者簡介:「算法邦」,隸屬于智猩猩,關(guān)注大模型、生成式AI、計(jì)算機(jī)視覺三大領(lǐng)域的研究與開發(fā),提供技術(shù)文章、講座、在線研討會(huì)。