單卡3小時訓練專屬大模型Agent

AIGC動態(tài)歡迎閱讀
原標題:單卡3小時訓練專屬大模型Agent
關鍵字:模型,知乎,工具,數(shù)據(jù),網(wǎng)頁
文章來源:算法邦
內(nèi)容字數(shù):12837字
內(nèi)容摘要:
今天給大家?guī)硪黄狝gent微調(diào)實戰(zhàn)文章-《單卡 3 小時訓練專屬大模型 Agent:基于 LLaMA Factory 實戰(zhàn)》,來自知乎@hiyouga。知乎:https://zhuanlan.zhihu.com/p/678989191Github:https://github.com/hiyouga/LLaMA-Factory
Agent(智能體)是當今 LLM(大模型)應用的熱門話題 [1],通過任務分解(task planning)、工具調(diào)用(tool using)和多智能體協(xié)作(multi-agent cooperation)等途徑,LLM Agent 有望突破傳統(tǒng)語言模型能力界限,體現(xiàn)出更強的智能水平。在這之中,調(diào)用外部工具解決問題成為 LLM Agent 必不可缺的一項技能,模型根據(jù)用戶問題從工具列表中選擇恰當?shù)墓ぞ撸瑫r生成工具調(diào)用參數(shù),綜合工具返回結果和上下文信息總結出答案。通過調(diào)用外部工具,LLM 能夠獲取到實時、準確的知識,大大降低了生成中的幻覺(hallucination)現(xiàn)象,使 LLM 的任務解決能力得到長足的提升。工具調(diào)用能力的獲得離不開模型微調(diào),盡管使用 
原文鏈接:單卡3小時訓練專屬大模型Agent
聯(lián)系作者
文章來源:算法邦
作者微信:allplusai
作者簡介:「算法邦」,隸屬于智猩猩,關注大模型、生成式AI、計算機視覺三大領域的研究與開發(fā),提供技術文章、講座、在線研討會。
 
  
  
  
 
 粵公網(wǎng)安備 44011502001135號
 粵公網(wǎng)安備 44011502001135號