<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        大模型端側 CPU 部署最高提效 6 倍!微軟亞研院新開源項目 T-MAC 技術解析來了

        AIGC動態9個月前發布 AI前線
        457 0 0

        大模型端側 CPU 部署最高提效 6 倍!微軟亞研院新開源項目 T-MAC 技術解析來了

        AIGC動態歡迎閱讀

        原標題:大模型端側 CPU 部署最高提效 6 倍!微軟亞研院新開源項目 T-MAC 技術解析來了
        關鍵字:比亞迪,華為,字節跳動,模型,范式
        文章來源:AI前線
        內容字數:0字

        內容摘要:


        為增強設備上的智能性,在邊緣設備部署大型語言模型(LLMs)成為了一個趨勢,比如微軟的 Windows 11 AI + PC。目前部署的大語言模型多會量化到低比特。然而,低比特 LLMs 在推理過程中需要進行低精度權重和高精度激活向量的混合精度矩陣乘法(mpGEMM)。現有的系統由于硬件缺乏對 mpGEMM 的原生支持,不得不將權重反量化以進行高精度計算。這種間接的方式導致了顯著的推理開銷,并且無法隨著比特數進一步降低而獲得加速。
        為此,微軟亞洲研究院的研究員們開發了 T-MAC。T-MAC 采用基于查找表(LUT)的計算范式,無需反量化,直接支持混合精度矩陣乘,其高效的推理性能以及其統一且可擴展的特性為在資源受限的邊緣設備上實際部署低比特 LLMs 鋪平了道路。
        此外,當前大模型的部署普遍依賴于專用加速器,如 NPU 和 GPU 等,而 T-MAC 可以擺脫專用加速器的依賴,僅利用 CPU 部署 LLMs,推理速度甚至能夠超過同一片上的專用加速器,使 LLMs 可以部署在各類包括 PC、手機、樹莓派等邊緣端設備。T-MAC 現已開源。在 CPU 上高效部署
        低比特大語言模型
        T-MA


        原文鏈接:大模型端側 CPU 部署最高提效 6 倍!微軟亞研院新開源項目 T-MAC 技術解析來了

        聯系作者

        文章來源:AI前線
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲今日精彩视频| 久久久亚洲精品蜜桃臀| 亚洲第一成年网站大全亚洲| 久久精品视频免费| 免费国产va在线观看| 青青青国产手机频在线免费观看| 亚洲福利精品一区二区三区| 78成人精品电影在线播放日韩精品电影一区亚洲 | 香港a毛片免费观看| 久久精品亚洲精品国产色婷 | 久久国产一片免费观看| 相泽亚洲一区中文字幕| 国产又黄又爽胸又大免费视频| 亚洲日韩精品射精日| 精品无码国产污污污免费网站| 亚洲天堂电影在线观看| 24小时日本在线www免费的| 牛牛在线精品观看免费正| 久久亚洲高清观看| 免费国产a理论片| 亚洲日韩小电影在线观看| 免费人妻无码不卡中文字幕系| 亚洲精品电影天堂网| 免费的一级片网站| 一个人晚上在线观看的免费视频 | 偷自拍亚洲视频在线观看| 国产亚洲精品a在线观看| 最近中文字幕2019高清免费| 亚洲无码一区二区三区 | 亚洲精品免费在线观看| 成年女人视频网站免费m| 免费VA在线观看无码| 亚洲AV无码乱码在线观看裸奔| 97性无码区免费| 免费无码国产在线观国内自拍中文字幕 | 午夜亚洲国产精品福利| 亚洲人成网址在线观看| 国产精品自在自线免费观看| 免费无码又爽又刺激网站| 亚洲偷偷自拍高清| 亚洲精品国产精品乱码不99 |