<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        開源賽道太擠了!月之暗面開源新版Muon優化器

        AIGC動態7個月前發布 機器之心
        571 0 0

        又「撞車」了。

        開源賽道太擠了!月之暗面開源新版Muon優化器

        原標題:開源賽道太擠了!月之暗面開源新版Muon優化器
        文章來源:機器之心
        內容字數:5559字

        月之暗面開源高效優化器Muon:算力減半,效果翻倍

        近日,月之暗面團隊搶先DeepSeek,開源了其改進版的Muon優化器,并發布了基于Muon訓練的3B/16B參數MoE模型Moonlight。該優化器在訓練大型語言模型方面展現出顯著優勢,僅需約52%的AdamW訓練FLOPs即可達到相當的性能,實現了算力減半,效果翻倍的目標。

        1. Muon優化器改進及高效性

          原始Muon優化器在小型語言模型訓練中表現出色,但擴展到大模型時性能提升減弱。月之暗面團隊通過添加權重衰減和一致的RMS更新兩項關鍵技術解決了這個問題。權重衰減防止模型權重過度增長,而一致的RMS更新確保了不同形狀矩陣之間更新的一致性,從而提高了Muon在大規模訓練中的穩定性和效率。Scaling law實驗表明,Muon的計算效率比AdamW提升了2倍。

        2. Moonlight模型及性能突破

          利用改進后的Muon優化器,月之暗面團隊訓練了Moonlight,一個3B/16B參數的MoE模型,訓練數據量達5.7萬億tokens。Moonlight刷新了當前的“帕累托前沿”,在相同訓練預算下,性能全面領先其他模型。它以更少的訓練FLOPs獲得了更好的性能,在語言、數學和編碼等任務上均表現出色。

        3. 分布式Muon及實驗結果

          團隊還提出了一種基于ZeRO-1的分布式Muon解決方案,提高了訓練效率。實驗結果表明,通過調整RMS值,Muon可以與AdamW保持一致性,并顯著提升模型性能。在與AdamW的對比實驗中,Muon在計算最優設置下,僅需約52%的訓練FLOPs即可達到與AdamW相當的性能。

        4. Muon在模型架構中的表現

          使用DeepSeek-V3-Small架構從頭開始預訓練的Moonlight模型,在與其他開源模型的比較中,展現出顯著的性能優勢,證明了Muon在模型架構中的有效性。此外,Muon還能使模型的權重更新更“多樣化”,尤其在MoE模型中表現突出。在預訓練和微調階段都使用Muon,模型表現最佳。

        5. 開源貢獻及未來研究

          月之暗面團隊開源了Muon的內存優化且通信高效的實現代碼,以及預訓練、指令調優和中間檢查點,為未來的研究提供了寶貴的資源。此次開源,再次體現了月之暗面在大型語言模型研究領域的領先地位。


        聯系作者

        文章來源:機器之心
        作者微信:
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 久久久国产精品福利免费| 久久综合亚洲色hezyo| a一级爱做片免费| 免费一级毛片正在播放| 国产精品亚洲精品爽爽| 免费在线观看一级毛片| 人成免费在线视频| 国产亚洲精品美女久久久| 成在线人免费无码高潮喷水| 亚洲欧洲日产国码av系列天堂| 国产亚洲精品欧洲在线观看| 日本无吗免费一二区| 美女的胸又黄又www网站免费| 波多野结衣一区二区免费视频| 伊人久久国产免费观看视频| 国内精品99亚洲免费高清| 成人性生交大片免费看好| 亚洲国产一区二区a毛片| 99精品视频在线视频免费观看| 亚洲精品国产专区91在线| 成年性午夜免费视频网站不卡| 亚洲乱码无人区卡1卡2卡3| 亚洲电影日韩精品| 免费无码H肉动漫在线观看麻豆| 老司机亚洲精品影院无码| 亚洲人成网站999久久久综合| 免费人成网站在线高清| 美女被免费网站91色| 亚洲美女视频网站| 国产成人高清精品免费软件| 中国在线观看免费的www| 亚洲成人一级电影| 免费日本黄色网址| 久久免费观看国产精品| 亚洲熟妇av午夜无码不卡| 中文字幕中韩乱码亚洲大片| 1000部国产成人免费视频| 国产亚洲日韩在线三区| 日本妇人成熟免费中文字幕| 免费无码国产在线观国内自拍中文字幕 | 亚洲日本韩国在线|