AIGC動態歡迎閱讀
原標題:阿里Qwen2大模型微調入門實戰(附完整代碼)
關鍵字:模型,侵權,知乎,數據,指令
文章來源:算法邦
內容字數:0字
內容摘要:
直播預告 | 6月20日晚7點,「智猩猩機器人新青年講座」第8講正式開講,清華大學THUNLP lab在讀博士胡錦毅將直播講解《面向多模態大模型的具身智能平臺LEGENT》,歡迎掃名~導讀本文來自知乎,作者為西安電子科技大學電子工程學院在讀博士林澤毅。出于學術/技術分享進行轉載,如有侵權,聯系刪文。
本文中,作者使用 Qwen2-1.5b-Instruct模型在復旦中文新聞數據集上做指令微調訓練,同時使用SwanLab監控訓練過程、評估模型效果。
原文鏈接:https://zhuanlan.zhihu.com/p/702491999Qwen2(https://modelscope.cn/models/qwen/Qwen2-1.5B-Instruct/summary)是通義千問團隊最近開源的大語言模型,由阿里云通義實驗室研發。
以Qwen2作為基座大模型,通過指令微調的方式做高精度文本分類,是學習LLM微調的入門任務。
在本文中,我們會使用 Qwen2-1.5b-Instruct(https://modelscope.cn/models/qwen/Qwen2-1.5B-Instruc
聯系作者
文章來源:算法邦
作者微信:allplusai
作者簡介:智猩猩矩陣賬號之一,聚焦生成式AI,重點關注模型與應用。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...