<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        大模型訓練開銷還能更小!微軟推出首個FP4訓練框架,訓練效果與BF16相當

        AIGC動態3個月前發布 量子位
        357 0 0

        中科大博士生一作

        大模型訓練開銷還能更小!微軟推出首個FP4訓練框架,訓練效果與BF16相當

        原標題:大模型訓練開銷還能更小!微軟推出首個FP4訓練框架,訓練效果與BF16相當
        文章來源:量子位
        內容字數:3919字

        微軟研究院發布FP4精度大模型訓練框架

        微軟亞洲研究院和SIGMA團隊近日發布了首個FP4精度的大模型訓練框架,該框架在相同超參數設置下,能達到與FP8和BF16相當的訓練效果,顯著降低了存儲和計算資源需求。此框架最高可訓練130億參數規模、千億級別Tokens的模型。

        1. 突破性進展:FP4精度訓練

        該框架通過在FP8的TensorCore上模擬FP4精度實現,而非使用真正的FP4硬件(目前尚未有原生支持FP4的硬件)。即便如此,該框架在1.3B、7B和13B的LLaMA模型訓練中,損失曲線與BF16基本一致,下游任務表現也相當。網友評論認為,這將是游戲規則的改變者,并預測此發現可能影響英偉達股價。

        2. 技術細節:定制化FP4矩陣乘法內核

        框架采用E2M1的FP4格式(2位指數,1位尾數,1位符號位),契合主流ML加速芯片設計。權重矩陣和激活矩陣分別采用列方向和行方向的量化策略,最大化FP4在矩陣乘法中的加速效果,避免額外矩陣轉置操作。框架使用scale+shift方法進行逐層量化參數校準。

        3. 創新性解決方法:可微分梯度估計和離群點處理

        為了解決直接對量化矩陣求導導致梯度幾乎為零的問題,該框架提出了一種新穎的可微分梯度估計方法。在前向計算中使用硬量化保證效率,在反向傳播中使用連續可微函數擬合量化函數,并計算梯度修正項。針對模型激活分布的長尾特征和離群點問題,框架采用“離群點削峰和補償”策略,先限幅離群點,再構造稀疏補償矩陣。

        4. 混合精度設計:提升效率

        框架采用混合精度設計,在梯度通信時使用FP8,優化器狀態存儲使用FP16,其他部分使用FP16,在保證數值穩定性的前提下降低計算和存儲開銷。

        5. 團隊介紹

        該框架由微軟亞洲研究院和SIGMA團隊的華人研究人員打造,第一作者是中科大在讀博士生王瑞哲(Ruizhe Wang),通訊作者為微軟亞洲研究院的程鵬和龔業耘。中科大查正軍教授、微軟亞洲研究院郭百寧也參與了該項目。

        6. 總結

        微軟研究院的這項研究成果,通過巧妙的模擬和創新性算法,實現了FP4精度的大模型訓練,為降低大模型訓練成本提供了新的方向,并有望推動大模型訓練技術進一步發展。 論文已發表在arXiv上。


        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲一区二区三区香蕉| 国产精品亚洲综合五月天| 日韩亚洲人成网站| 在线A级毛片无码免费真人| 亚洲熟妇无码一区二区三区导航 | 91黑丝国产线观看免费 | 日日操夜夜操免费视频| 亚洲GV天堂无码男同在线观看| 91免费精品国自产拍在线不卡| 亚洲精品一级无码鲁丝片| 高潮毛片无遮挡高清免费| 亚洲日韩中文在线精品第一| 男女拍拍拍免费视频网站| 亚洲人成人无码网www电影首页 | 精品国产污污免费网站aⅴ| 亚洲中文无韩国r级电影| 日本高清不卡aⅴ免费网站| 亚洲AV无码乱码在线观看裸奔 | 国产一区二区三区免费观看在线| 亚洲国产精品无码专区| 2022久久国产精品免费热麻豆| 亚洲免费视频网址| 国产资源免费观看| 成年女人A毛片免费视频| 亚洲成a人片77777老司机| 久久久久无码精品亚洲日韩| 亚洲一区二区三区免费| 亚洲av鲁丝一区二区三区| 一本岛高清v不卡免费一三区| 亚洲精品乱码久久久久久蜜桃不卡| A片在线免费观看| 亚洲一卡2卡3卡4卡国产网站| 国产成人青青热久免费精品| 天黑黑影院在线观看视频高清免费| 亚洲网站在线免费观看| 国产福利免费观看| 久久九九AV免费精品| 亚洲性猛交XXXX| 91成人免费在线视频| 一级毛片免费视频网站| 国产大片91精品免费观看男同|