<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        大模型終端部署新趨勢:硬件直接支持混合矩陣乘法

        AIGC動態9個月前發布 機器之心
        409 0 0

        大模型終端部署新趨勢:硬件直接支持混合矩陣乘法

        AIGC動態歡迎閱讀

        原標題:大模型終端部署新趨勢:硬件直接支持混合矩陣乘法
        關鍵字:模型,乘法,精度,硬件,數據類型
        文章來源:機器之心
        內容字數:0字

        內容摘要:


        AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com在人工智能領域,模型參數的增多往往意味著性能的提升。但隨著模型規模的擴大,其對終端設備的算力與內存需求也日益增加。低比特量化技術,由于可以大幅降低存儲和計算成本并提升推理效率,已成為實現大模型在資源受限設備上高效運行的關鍵技術之一。然而,如果硬件設備不支持低比特量化后的數據模式,那么低比特量化的優勢將無法發揮。
        為了解決這一問題,微軟亞洲研究院推出了全新的數據編譯器 Ladder 和算法 T-MAC,使當前只支持對稱精度計算的硬件能夠直接運行混合精度矩陣乘法。測試結果表明,Ladder 在支持 GPU 原本不支持的自定義數據類型方面,最高提速可達 14.6 倍;T-MAC 在搭載了最新高通 Snapdragon X Elite 芯片組的 Surface AI


        原文鏈接:大模型終端部署新趨勢:硬件直接支持混合矩陣乘法

        聯系作者

        文章來源:機器之心
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲第一视频在线观看免费| 成年男女男精品免费视频网站| 亚洲国产天堂久久综合| 亚洲AV日韩AV永久无码色欲| 日韩一区二区三区免费体验| 亚洲熟妇少妇任你躁在线观看| 亚洲一区二区免费视频| 亚洲精品中文字幕麻豆| 最近免费2019中文字幕大全| 久久精品国产亚洲AV嫖农村妇女| 日本免费一区二区三区| 亚洲欧洲视频在线观看| 毛片免费全部免费观看| 亚洲AⅤ男人的天堂在线观看| 五月婷婷亚洲综合| 成年女人A毛片免费视频| 亚洲男人的天堂www| 久久久精品免费视频| 亚洲第一页中文字幕| 韩国18福利视频免费观看| 国产亚洲精品2021自在线| 亚洲精品久久久www| 亚欧免费一级毛片| 亚洲人成www在线播放| 国产国产人免费人成免费视频| ssswww日本免费网站片| 久久亚洲私人国产精品| 午夜网站免费版在线观看| 一级a性色生活片久久无少妇一级婬片免费放| 三上悠亚亚洲一区高清| 9420免费高清在线视频| 亚洲精品国产摄像头| 亚洲婷婷国产精品电影人久久| 日韩视频在线观看免费| 亚洲日韩一区精品射精| 亚洲精品无码永久在线观看你懂的 | 国产成人无码精品久久久久免费| 亚洲av永久无码精品秋霞电影影院| 91视频国产免费| 一个人看的免费观看日本视频www| 亚洲国语精品自产拍在线观看 |