<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        FP8 低精度訓練:Transformer Engine 簡析

        AIGC動態(tài)1年前 (2024)發(fā)布 智猩猩AGI
        419 0 0

        FP8 低精度訓練:Transformer Engine 簡析

        AIGC動態(tài)歡迎閱讀

        原標題:FP8 低精度訓練:Transformer Engine 簡析
        關(guān)鍵字:精度,模型,數(shù)據(jù),數(shù)值,框架
        文章來源:智猩猩AGI
        內(nèi)容字數(shù):0字

        內(nèi)容摘要:


        大模型時代最火AI芯片峰會來啦!!9月6-7日,由智猩猩聯(lián)合主辦的2024全球AI芯片峰會將在北京舉行。峰會設有數(shù)據(jù)中心AI芯片、智算集群技術(shù)論壇等7大板塊。目前,清華大學教授、集成電路學院副院長尹首一 ,AMD人工智能事業(yè)部高級總監(jiān)王宏強,高通AI產(chǎn)品技術(shù)中國區(qū)負責人萬衛(wèi)星,摩爾線程高級產(chǎn)品總監(jiān)付海良波等30+位嘉賓已確認參會。掃名~原文:https://zhuanlan.zhihu.com/p/700874387
        01背景介紹業(yè)界廣泛采用 FP16、BF16 混合精度(AMP)進行模型訓練。AMP 能在下游任務不掉點的前提下提升訓練效率、減少顯存等資源占用,如今也常用于大模型預訓練、微調(diào)等任務。
        Pytorch 1.6 版本后原生支持 FP16、BF16 精度的 AMP 訓練(torch.amp),過往 AMP 功能由 NVIDIA APEX 庫實現(xiàn)。
        NVIDIA GPU 自 Hopper 架構(gòu)起支持 FP8 精度的 Tensor Core 計算,相比于 FP16/BF16 精度,F(xiàn)P8 具有如下優(yōu)勢:
        更強的計算性能
        對比 A100 BF16 精度訓練,H100 FP8 訓


        原文鏈接:FP8 低精度訓練:Transformer Engine 簡析

        聯(lián)系作者

        文章來源:智猩猩AGI
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 人体大胆做受免费视频| 狠狠躁狠狠爱免费视频无码| 亚洲一区二区三区在线观看蜜桃| 亚洲国产成人久久精品大牛影视| 永久免费观看黄网站| 亚洲国产aⅴ综合网| 亚洲视频在线免费看| 农村寡妇一级毛片免费看视频| 69视频免费观看l| 久久久久一级精品亚洲国产成人综合AV区| 亚洲精品无码专区在线播放| 亚洲欧美日韩中文无线码| 一级女人18毛片免费| 亚洲av中文无码乱人伦在线咪咕| 亚洲欧美aⅴ在线资源| 爽爽日本在线视频免费| 亚洲成人在线电影| 亚洲精品国产日韩无码AV永久免费网 | 亚洲人成网男女大片在线播放| 一级女人18片毛片免费视频| 国产美女在线精品免费观看| 亚洲性天天干天天摸| 在线综合亚洲中文精品| 18禁成年无码免费网站无遮挡 | 亚洲av午夜国产精品无码中文字| 毛片无码免费无码播放 | 亚洲国产日韩成人综合天堂| 亚洲国产精品综合一区在线| 中文成人久久久久影院免费观看| 四虎永久成人免费| 日本亚洲欧美色视频在线播放| 亚洲精品色婷婷在线影院| 男人都懂www深夜免费网站| 亚洲精品成人片在线播放| 亚洲国产免费综合| 亚洲国产高清美女在线观看| 国产青草视频免费观看97 | 亚洲天堂一区二区三区| 国产精品免费看久久久无码| a级毛片视频免费观看| 亚洲国产最大av|