<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        性能對標Llama 3,算力消耗僅1/19!源2.0-M32大幅提升模算效率

        AIGC動態12個月前發布 智東西
        888 0 0

        性能對標Llama 3,算力消耗僅1/19!源2.0-M32大幅提升模算效率

        AIGC動態歡迎閱讀

        原標題:性能對標Llama 3,算力消耗僅1/19!源2.0-M32大幅提升模算效率
        關鍵字:模型,浪潮,企業,信息,專家
        文章來源:智東西
        內容字數:0字

        內容摘要:


        模更強,算更優!集成32個專家、模算效率大幅提升,浪潮信息讓大模型應用火力全開。
        作者|程茜
        編輯|漠影
        智東西5月28日報道,今天,浪潮信息發布基于MoE的源2.0-M32開源大模型,全面開源且支持免費可商用,全系列模型參數和代碼均可免費下載使用。源2.0-M32采用基于注意力機制的門控網絡技術,包含32個專家模塊,參數量為400億,模型運行時激活參數為37億。同時,該模型在模型性能全面對標700億參數規模Llama 3的同時,訓練、微調、推理過程中的算力開銷顯著低于業界的頭部開源模型Llama3-70B,源2.0-M32單Token下訓練和推理所需的算力資源僅為Llama3-70B的1/19。
        在模型推理運行階段,源2.0-M32處理每Token所需算力為7.4GFLOPs,Llama3-70B所需算力為140GFLOPs。
        在模型微調訓練階段,對1萬條平均長度為1024 Token的樣本進行全量微調,M32消耗算力為0.0026PD(PetaFLOPs/s-day),Llama3-70B為0.05PD。
        可以看出,源2.0-M32正在提升模型性能與降低算力消耗上齊頭并進,成為浪潮


        原文鏈接:性能對標Llama 3,算力消耗僅1/19!源2.0-M32大幅提升模算效率

        聯系作者

        文章來源:智東西
        作者微信:zhidxcom
        作者簡介:智能產業新媒體!智東西專注報道人工智能主導的前沿技術發展,和技術應用帶來的千行百業產業升級。聚焦智能變革,服務產業升級。

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: h视频在线免费观看| 亚洲一区二区高清| 日本一道本不卡免费| 午夜亚洲WWW湿好爽| 亚洲国产亚洲片在线观看播放 | 亚洲精品白色在线发布| 国产成人亚洲综合| 在线观看免费精品国产| 免免费国产AAAAA片| 色欲色香天天天综合网站免费 | 最新仑乱免费视频| 99精品视频免费在线观看| 国产免费MV大全视频网站| 最新亚洲人成无码网www电影| 亚洲午夜在线一区| 亚洲电影一区二区| 国产精品亚洲片在线| 亚洲男人第一无码aⅴ网站| 国产日产成人免费视频在线观看| 99在线精品免费视频九九视| 日本黄网站动漫视频免费| 久草视频在线免费看| 人妻免费一区二区三区最新| 中文字幕不卡免费高清视频| 三年片在线观看免费观看大全中国 | 国产婷婷综合丁香亚洲欧洲| 亚洲人成777在线播放| 亚洲神级电影国语版| 亚洲第一永久在线观看| 亚洲理论在线观看| 亚洲入口无毒网址你懂的| 亚洲一线产区二线产区精华| 亚洲国产精品白丝在线观看 | 一本岛高清v不卡免费一三区| 成人免费大片免费观看网站| 久久WWW免费人成一看片| 日本h在线精品免费观看| 美女被cao免费看在线看网站| 国产成人午夜精品免费视频| 无人在线观看免费高清视频 | 亚洲美女视频一区|