<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        一行代碼Post-Train任意長序列!360智腦開源360-LLaMA-Factory

        AIGC動態4個月前發布 機器之心
        292 0 0

        支持序列并行的LLaMA-Factory

        一行代碼Post-Train任意長序列!360智腦開源360-LLaMA-Factory

        原標題:一行代碼Post-Train任意長序列!360智腦開源360-LLaMA-Factory
        文章來源:機器之心
        內容字數:8718字

        360智腦開源360-LLaMA-Factory:輕松實現大模型長序列后訓練

        機器之心AIxiv專欄報道了360智腦開源的360-LLaMA-Factory項目。該項目基于LLaMA-Factory,新增序列并行功能,顯著提升了大模型長序列后訓練的能力。此舉解決了現有開源框架在長序列后訓練方面存在的不足,為處理復雜長文本任務、多幀視頻理解任務以及高計算量的大模型提供了強有力的支持。

        1. 項目背景與簡介

        隨著大模型處理長序列的需求日益增長,預訓練和后訓練階段都需要支持更長序列數據的訓練。雖然預訓練階段已有Megatron-LM等框架支持序列并行,但后訓練階段因算法多樣性和需求靈活性,缺乏一個兼顧并行策略、算法多樣性、GPU顯存優化和易用性的框架。LLaMA-Factory作為用戶最多的開源后訓練框架,雖然功能豐富,但在長序列支持上仍有欠缺,尤其缺乏序列并行功能。

        360智腦基于LLaMA-Factory開發了360-LLaMA-Factory,填補了這一空白。該項目通過添加一行代碼sequence_parallel_size: 16即可實現任意長度的序列后訓練,只需按需增加GPU卡數即可。該項目已在內部經過嚴格驗證,并提交了Pull Request給LLaMA-Factory主倉。

        2. 長序列及其后訓練

        長序列大模型訓練面臨的關鍵挑戰是激活顯存隨序列長度大幅增加。雖然一些技術如unsloth、liger kernel和LoRA可以降低顯存占用,但效果有限。序列并行是解決這一問題的有效途徑,它將長序列切分到多張GPU卡上計算,避免單卡處理過長序列。然而,序列并行的實現難度較大,需要復雜的通信和attention計算修改。

        360-LLaMA-Factory對現有的一些支持序列并行的開源框架進行了調研,發現它們存在一些問題,例如實現錯誤、算法支持不全、更新維護不及時等。360-LLaMA-Factory在繼承LLaMA-Factory、ring-flash-attention和EasyContext等開源項目的基礎上,進行了模塊化改進和優化,并對SFT和DPO訓練器進行了適配。

        3. 360-LLaMA-Factory框架解析

        360-LLaMA-Factory通過模塊化封裝,對原始代碼修改最小化。它在model_args中添加參數并抽象出apply_sequence_parallel函數來修改模型,并用decorator抽象數據處理函數,最后在Trainer中進行loss計算的reduce匯總。針對SFT和DPO,進行了最小化的定制化修改,并通過測試驗證了其正確性。

        4. 360-LLaMA-Factory效果驗證

        360-LLaMA-Factory內部已用于訓練開源模型360Zhinao2-7B-Chat-360k。通過小數據集測試,驗證了序列并行對訓練曲線的影響微乎其微。粗粒度壓測表明,8卡80G的配置下,SFT和DPO訓練可支持幾十到幾百k的超長序列。

        5. 總結

        360-LLaMA-Factory通過簡單易用的方式實現了長序列后訓練,為大模型應用提供了有力支持。其模塊化設計、正確性驗證以及高效的性能使其成為一個值得推薦的開源項目。歡迎開發者使用和貢獻代碼。


        聯系作者

        文章來源:機器之心
        作者微信:
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲人av高清无码| 亚洲美女一区二区三区| 亚洲Av无码国产一区二区| 欧美a级在线现免费观看| 国产成人免费在线| 亚洲成A人片在线观看无码不卡| 亚洲免费日韩无码系列| a级亚洲片精品久久久久久久| 国产免费一区二区三区免费视频| 国产午夜亚洲精品午夜鲁丝片| 一级做受视频免费是看美女 | 亚洲乱码日产精品一二三| 99久久久国产精品免费无卡顿| 亚洲国产午夜精品理论片| 1024免费福利永久观看网站| 亚洲天堂一区二区三区四区| 日本精品人妻无码免费大全| 无码色偷偷亚洲国内自拍| 亚洲五月午夜免费在线视频| 91嫩草亚洲精品| 日韩精品成人无码专区免费| WWW亚洲色大成网络.COM| 国产亚洲精品国看不卡| 久久久久免费精品国产| 亚洲国产成人精品青青草原| 青青草国产免费久久久下载| 一级毛片人与动免费观看| 亚洲午夜精品一区二区| 成人男女网18免费视频| 一区二区三区免费高清视频| 亚洲av无码乱码国产精品fc2 | 久久国产乱子伦精品免费一 | 亚洲中文字幕无码爆乳AV| 精品熟女少妇a∨免费久久| 亚洲日韩国产AV无码无码精品| 国产精品亚洲综合一区| 免费A级毛片无码A∨免费| 国产精品亚洲AV三区| 亚洲成AV人在线观看天堂无码| 成年人免费观看视频网站| 西西人体免费视频|