<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        大模型端側 CPU 部署最高提效 6 倍!微軟亞研院新開源項目 T-MAC 技術解析來了

        AIGC動態1年前 (2024)發布 AI前線
        462 0 0

        大模型端側 CPU 部署最高提效 6 倍!微軟亞研院新開源項目 T-MAC 技術解析來了

        AIGC動態歡迎閱讀

        原標題:大模型端側 CPU 部署最高提效 6 倍!微軟亞研院新開源項目 T-MAC 技術解析來了
        關鍵字:比亞迪,華為,字節跳動,模型,范式
        文章來源:AI前線
        內容字數:0字

        內容摘要:


        為增強設備上的智能性,在邊緣設備部署大型語言模型(LLMs)成為了一個趨勢,比如微軟的 Windows 11 AI + PC。目前部署的大語言模型多會量化到低比特。然而,低比特 LLMs 在推理過程中需要進行低精度權重和高精度激活向量的混合精度矩陣乘法(mpGEMM)。現有的系統由于硬件缺乏對 mpGEMM 的原生支持,不得不將權重反量化以進行高精度計算。這種間接的方式導致了顯著的推理開銷,并且無法隨著比特數進一步降低而獲得加速。
        為此,微軟亞洲研究院的研究員們開發了 T-MAC。T-MAC 采用基于查找表(LUT)的計算范式,無需反量化,直接支持混合精度矩陣乘,其高效的推理性能以及其統一且可擴展的特性為在資源受限的邊緣設備上實際部署低比特 LLMs 鋪平了道路。
        此外,當前大模型的部署普遍依賴于專用加速器,如 NPU 和 GPU 等,而 T-MAC 可以擺脫專用加速器的依賴,僅利用 CPU 部署 LLMs,推理速度甚至能夠超過同一片上的專用加速器,使 LLMs 可以部署在各類包括 PC、手機、樹莓派等邊緣端設備。T-MAC 現已開源。在 CPU 上高效部署
        低比特大語言模型
        T-MA


        原文鏈接:大模型端側 CPU 部署最高提效 6 倍!微軟亞研院新開源項目 T-MAC 技術解析來了

        聯系作者

        文章來源:AI前線
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 很黄很黄的网站免费的| 久久久精品视频免费观看| 91精品视频免费| 亚洲欧洲在线播放| 精品国产污污免费网站aⅴ| 日韩亚洲AV无码一区二区不卡| 一级毛片免费观看| 亚洲国产精品美女| 在线观看视频免费国语| 亚洲aⅴ天堂av天堂无码麻豆| 国产做床爱无遮挡免费视频| 日本中文字幕免费看| 最新精品亚洲成a人在线观看| 在线观看片免费人成视频播放| 亚洲国产精品成人精品无码区 | 亚洲六月丁香婷婷综合| 日韩一级视频免费观看| 日本一区二区三区免费高清在线| 久久精品国产精品亚洲精品| 精品一区二区三区免费毛片爱| 亚洲喷奶水中文字幕电影 | 成年性午夜免费视频网站不卡| 亚洲真人无码永久在线观看| 免费在线观看理论片| 中文字幕在线视频免费观看| 亚洲今日精彩视频| 天天拍拍天天爽免费视频| 一级毛片免费毛片毛片| 亚洲天堂久久精品| 四虎影视免费永久在线观看 | 亚洲日韩精品无码专区加勒比| yy6080久久亚洲精品| 欧洲人免费视频网站在线| 在线精品亚洲一区二区| 国产亚洲美日韩AV中文字幕无码成人 | 免费观看午夜在线欧差毛片| 国产精品免费一区二区三区四区| 亚洲中文字幕无码久久2020| 亚洲综合国产一区二区三区| 欧美男同gv免费网站观看| 久久国产福利免费|