AIGC動態歡迎閱讀
原標題:全是細節!大模型SFT的100個關鍵點
關鍵字:模型,數據,報告,能力,語料
文章來源:智猩猩GenAI
內容字數:0字
內容摘要:
GTIC 2024中國AI PC創新峰會將于10月11日,在2024上海國際消費電子展TechG同期舉辦。聯想集團首席研究員顏毅強、榮耀終端有限公司PC產品研發系統部部長席迎軍等7位嘉賓,將分別圍繞面向大模型的個人計算體系和交互、AI 重構PC、RISC-V AI芯片、AIGC在端側產品的發展、操作系統與AI技術結合探索、聯合模型和硬件的優化適配平臺MLGuider、智能體個人助理等議題進行演講,歡迎報名~導讀原文來自知乎,作者為ybq,標題為《LLM訓練-sft》。作者詳細介紹了大模型的 sft 相關內容,包括背景知識、與 pretrain 的區別、幻覺問題、數據篇(數據多樣性、生產、去重等)、訓練篇(框架、煉丹技巧、擬合問題等)、評估篇等。原文地址:https://zhuanlan.zhihu.com/p/809229182
本文只做學術/技術分享,如有侵權,聯系刪文。這篇文章介紹一下大模型的 sft 如何去做。相比較于上一篇文章介紹的 pretrain,sft 實在沒有太多的技術細節和瑣碎工作需要科普。因此,我會默認讀者們都知道 sft 是做什么的以及如何去做一些簡單的 sft
原文鏈接:全是細節!大模型SFT的100個關鍵點
聯系作者
文章來源:智猩猩GenAI
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...