<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        DeepSeek開源第二天:拉爆MoE訓練和推理

        DeepSeek開源第二天:拉爆MoE訓練和推理

        原標題:DeepSeek開源第二天:拉爆MoE訓練和推理
        文章來源:夕小瑤科技說
        內容字數:5656字

        DeepSeek開源DeepEP:MoE模型訓練推理性能利器

        DeepSeek近日開源了DeepEP,一個專為混合專家模型(MoE)訓練和推理設計的通信庫,旨在極致提升性能。DeepEP通過高效的All-to-All通信,在訓練和推理場景下都實現了高吞吐和低延遲,堪稱MoE模型的性能加速神器。

        1. MoE與EP詳解

        混合專家模型(MoE)通過將模型拆分成多個“專家”子網絡,根據輸入數據選擇合適的專家進行處理,從而提升計算效率。專家并行(EP)則是一種并行計算方式,將不同的專家分配到不同的GPU上,實現并行計算。MoE模型在推理時,并非所有專家都參與計算,例如DeepSeek-R1模型,其671B參數量在推理時僅激活37B,256個專家中僅激活8個。這過程中,需要高效的通信機制來協調不同GPU上的專家協同工作。

        2. DeepEP的核心優勢

        DeepEP的核心在于其高效的All-to-All通信機制,它利用NVLink和RDMA技術,分別針對高吞吐和低延遲場景設計了兩種通信內核:

        1. 高吞吐內核:利用NVLink和RDMA的組合,實現極高的吞吐量(實測最高達153GB/s,接近NVLink理論極限160GB/s),適用于訓練和快速處理文本等場景。
        2. 低延遲內核:僅使用RDMA,將延遲降至微秒級(實測帶寬最高達46GB/s),適用于對延遲敏感的大模型解碼場景。

        DeepEP還支持節點內/跨節點通信,并提供SM數量控制接口,靈活分配GPU資源。此外,其集成的通信計算重疊機制,通過后臺并行接收數據,不占用任何SM資源,最大化GPU利用率。

        3. DeepEP的技術細節

        DeepEP通過以下技術手段實現了卓越的性能:

        1. 通信計算重疊:利用hook機制實現通信和計算重疊,在不影響計算的情況下完成數據傳輸。
        2. SM資源優化:DeepSeek在訓練V3模型時,將部分SM資源專門用于通信任務,優化資源利用。
        3. PTX指令挖掘:DeepEP發現了并使用了NVIDIA文檔中未記錄的PTX指令`ld.global.nc.L1::no_allocate.L2::256B`,進一步提升性能(需注意其潛在的未定義行為)。

        4. 總結

        DeepEP作為首個用于MoE模型訓練和推理的開源EP通信庫,通過高效的通信機制和精細的資源管理,顯著提升了MoE模型的性能。其高吞吐和低延遲的特性,使其成為大規模MoE模型訓練和推理的理想選擇。DeepEP的開源,為MoE模型的進一步發展提供了強有力的支持,也展現了DeepSeek在性能極致追求上的不懈努力。


        聯系作者

        文章來源:夕小瑤科技說
        作者微信:
        作者簡介:低負擔解碼AI世界,硬核也可愛!聚集35萬AI發燒友、開發者和從業者,廣泛覆蓋互聯網大廠中高管、AI公司創始人和機構投資人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備敏銳的行業嗅覺和洞察深度。商務合作:zym5189

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 四虎免费在线观看| 免费一级毛片不卡在线播放| 亚洲综合网站色欲色欲| 色噜噜AV亚洲色一区二区| 免费精品国自产拍在线播放| 日本久久久免费高清| 亚洲人成精品久久久久| 香蕉免费一级视频在线观看| 成视频年人黄网站免费视频| 亚洲国产精品综合久久一线| 3d动漫精品啪啪一区二区免费| 亚洲2022国产成人精品无码区 | 亚洲女同成人AⅤ人片在线观看| 国产成人高清亚洲一区91| yy6080久久亚洲精品| 日木av无码专区亚洲av毛片| 黄色片网站在线免费观看| 亚洲精品乱码久久久久久不卡| 国产无遮挡又黄又爽免费网站| 亚洲成a人片在线观看无码| 91香蕉在线观看免费高清| 丁香婷婷亚洲六月综合色| 国产成人高清精品免费鸭子| caoporm碰最新免费公开视频| 午夜免费福利影院| 黄色三级三级免费看| 久久精品亚洲中文字幕无码网站 | 亚洲午夜在线电影| 美女被免费网站91色| 老司机亚洲精品影院| 午夜成人免费视频| 国产精品美女久久久免费| 亚洲视频精品在线| 在线永久免费观看黄网站| 中文字幕无码免费久久9一区9| 久久精品国产亚洲av高清漫画| 国产精品久久久久久久久久免费 | 亚洲色在线无码国产精品不卡| 98精品全国免费观看视频| 亚洲砖码砖专无区2023| 久久精品国产亚洲7777|