<label id="3dn8r"><mark id="3dn8r"></mark></label>

<span id="3dn8r"></span>

<span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

<center id="iwsgc"></center>

<dl id="iwsgc"></dl>

<code id="iwsgc"></code>

<table id="iwsgc"><wbr id="iwsgc"></wbr></table>

大模型端側 CPU 部署最高提效 6 倍！微軟亞研院新開源項目 T-MAC 技術解析來了

AIGC動態11個月前發布 AI前線

461 0 0

大模型端側 CPU 部署最高提效 6 倍！微軟亞研院新開源項目 T-MAC 技術解析來了

AIGC動態歡迎閱讀

原標題：大模型端側 CPU 部署最高提效 6 倍！微軟亞研院新開源項目 T-MAC 技術解析來了
關鍵字：比亞迪,華為,字節跳動,模型,范式
文章來源：AI前線
內容字數：0字

內容摘要：

為增強設備上的智能性，在邊緣設備部署大型語言模型（LLMs）成為了一個趨勢，比如微軟的 Windows 11 AI + PC。目前部署的大語言模型多會量化到低比特。然而，低比特 LLMs 在推理過程中需要進行低精度權重和高精度激活向量的混合精度矩陣乘法（mpGEMM）。現有的系統由于硬件缺乏對 mpGEMM 的原生支持，不得不將權重反量化以進行高精度計算。這種間接的方式導致了顯著的推理開銷，并且無法隨著比特數進一步降低而獲得加速。
為此，微軟亞洲研究院的研究員們開發了 T-MAC。T-MAC 采用基于查找表（LUT）的計算范式，無需反量化，直接支持混合精度矩陣乘，其高效的推理性能以及其統一且可擴展的特性為在資源受限的邊緣設備上實際部署低比特 LLMs 鋪平了道路。
此外，當前大模型的部署普遍依賴于專用加速器，如 NPU 和 GPU 等，而 T-MAC 可以擺脫專用加速器的依賴，僅利用 CPU 部署 LLMs，推理速度甚至能夠超過同一片上的專用加速器，使 LLMs 可以部署在各類包括 PC、手機、樹莓派等邊緣端設備。T-MAC 現已開源。在 CPU 上高效部署
低比特大語言模型
T-MA

原文鏈接：大模型端側 CPU 部署最高提效 6 倍！微軟亞研院新開源項目 T-MAC 技術解析來了

聯系作者

文章來源：AI前線
作者微信：
作者簡介：

# AIGC動態 # 華為 # 字節跳動 # 模型 # 比亞迪 # 范式

? 版權聲明

文章版權歸作者所有，未經允許請勿轉載。

蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...

主站蜘蛛池模板：午夜精品一区二区三区免费视频| 亚洲日韩一区二区三区| sihu国产精品永久免费| 国产成人免费一区二区三区| 日韩亚洲产在线观看| 无码国产精品久久一区免费| 亚洲日韩乱码中文无码蜜桃臀| 亚洲精品免费视频| 亚洲Av综合色区无码专区桃色| 久久成人永久免费播放| 国产亚洲综合成人91精品 | 一级美国片免费看| 在线观看亚洲精品福利片| 久久精品国产亚洲AV麻豆王友容| 国产一级一毛免费黄片| 亚洲av无码国产精品色午夜字幕| 午夜不卡久久精品无码免费| 久久亚洲精品中文字幕| 色片在线免费观看| 亚洲综合伊人久久大杳蕉| 99久久国产精品免费一区二区 | 一个人看的免费观看日本视频www| 亚洲国产精品自在拍在线播放| 久久九九久精品国产免费直播| 亚洲精品乱码久久久久久蜜桃不卡| 久久免费观看国产精品88av| 亚洲性无码av在线| 国产无遮挡又黄又爽免费视频| 猫咪免费人成网站在线观看入口 | 亚洲永久精品ww47| 在线观看免费视频资源| 亚洲字幕AV一区二区三区四区| 亚洲成AⅤ人影院在线观看| 国产免费一区二区三区不卡| 亚洲一区免费在线观看| 亚洲无码在线专区| 亚洲一级免费毛片| 久久久精品国产亚洲成人满18免费网站 | 免费国产黄网站在线看| 久久精品国产亚洲香蕉| 成人免费视频试看120秒|

<code id="acuii"><delect id="acuii"></delect></code>

<rt id="acuii"><tr id="acuii"></tr></rt>

<li id="acuii"><dl id="acuii"></dl></li>

<rt id="acuii"><tr id="acuii"></tr></rt>

<button id="acuii"><input id="acuii"></input></button>