<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        微軟開源爆火1.58bit大模型推理框架!千億參數模型量化后單CPU可跑,速度每秒5-7個token

        AIGC動態7個月前發布 量子位
        449 0 0

        微軟開源爆火1.58bit大模型推理框架!千億參數模型量化后單CPU可跑,速度每秒5-7個token

        AIGC動態歡迎閱讀

        原標題:微軟開源爆火1.58bit大模型推理框架!千億參數模型量化后單CPU可跑,速度每秒5-7個token
        關鍵字:模型,框架,權重,參數,微軟
        文章來源:量子位
        內容字數:0字

        內容摘要:


        西風 發自 凹非寺量子位 | 公眾號 QbitAI微軟開源1bit大模型推理框架!
        現在1000億參數大模型量化后單CPU可跑,速度可達每秒5-7個token。
        比如在蘋果M2新品上運行BitNet b1.58 3B模型,be like:
        就是今年爆火論文The Era of 1-bit LLMs的官方代碼實現,開源不到一周GitHub已攬獲7.9k Star。
        傳統大模型參數以16位浮點數(如FP16或BF16)形式的存儲,而BitNet b1.58將其統統變成了三進制,也就是{-1, 0, 1}。
        這里的“1.58 bit”指每個參數可以用1.58位的信息來表示。
        轉換之后,矩陣中的計算就只會涉及到加法,因此會讓大模型在保持一定精度的同時,顯著減少所需的存儲空間和計算資源,也顯著提升了在本地設備上運行LLM的可能性。
        這個項目開源后,在X上也受到了一波高度關注。
        千億參數模型量化后單CPU可跑bitnet.cpp是1bit LLM(例如 BitNet b1.58)的官方推理框架。
        該框架配備了一系列優化內核,支持在CPU上進行快速且無損的1.58bit模型推理,未來將擴展支持NPU


        原文鏈接:微軟開源爆火1.58bit大模型推理框架!千億參數模型量化后單CPU可跑,速度每秒5-7個token

        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 很黄很污的网站免费| 亚洲熟女www一区二区三区| 九九全国免费视频| 国产在线ts人妖免费视频| 亚洲精品无码你懂的| 成年人视频在线观看免费 | 亚洲中文字幕久久精品无码喷水| 国产精品亚洲综合| 在线a亚洲v天堂网2018| 四虎影视永久在线精品免费| 亚洲天堂在线视频| 久久精品国产免费一区| 亚洲精品动漫在线| 最近的免费中文字幕视频| 亚洲av午夜电影在线观看| 亚洲成av人在片观看| 你懂的免费在线观看| 亚洲小视频在线观看| 中文字幕无码视频手机免费看| 亚洲人av高清无码| av在线亚洲欧洲日产一区二区| 日本免费A级毛一片| 亚洲人成网站在线观看播放青青| 成人免费无码大片a毛片| 国产精品亚洲а∨无码播放不卡 | 中国亚洲呦女专区| jjzz亚洲亚洲女人| 黄网站免费在线观看| 亚洲国产成人久久| 男人的天堂亚洲一区二区三区| 老湿机一区午夜精品免费福利| 亚洲中文字幕在线乱码| 亚洲第一网站免费视频| 亚洲国产精品嫩草影院| 亚洲一区二区三区AV无码| 国产92成人精品视频免费 | 在线涩涩免费观看国产精品| 亚洲六月丁香婷婷综合| 亚洲乱码日产精品a级毛片久久| 久久免费视频精品| 国产一区二区三区亚洲综合 |