<label id="3dn8r"><mark id="3dn8r"></mark></label>

<span id="3dn8r"></span>

<span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

<nav id="eukou"></nav>

<li id="eukou"></li>

<li id="eukou"><source id="eukou"></source></li>

<li id="eukou"><tbody id="eukou"></tbody></li>

<li id="eukou"></li>

<li id="eukou"></li>

微軟開源爆火1.58bit大模型推理框架！千億參數模型量化后單CPU可跑，速度每秒5-7個token

AIGC動態7個月前發布量子位

449 0 0

微軟開源爆火1.58bit大模型推理框架！千億參數模型量化后單CPU可跑，速度每秒5-7個token

AIGC動態歡迎閱讀

原標題：微軟開源爆火1.58bit大模型推理框架！千億參數模型量化后單CPU可跑，速度每秒5-7個token
關鍵字：模型,框架,權重,參數,微軟
文章來源：量子位
內容字數：0字

內容摘要：

西風發自凹非寺量子位 | 公眾號 QbitAI微軟開源1bit大模型推理框架！
現在1000億參數大模型量化后單CPU可跑，速度可達每秒5-7個token。
比如在蘋果M2新品上運行BitNet b1.58 3B模型，be like：
就是今年爆火論文The Era of 1-bit LLMs的官方代碼實現，開源不到一周GitHub已攬獲7.9k Star。
傳統大模型參數以16位浮點數（如FP16或BF16）形式的存儲，而BitNet b1.58將其統統變成了三進制，也就是{-1, 0, 1}。
這里的“1.58 bit”指每個參數可以用1.58位的信息來表示。
轉換之后，矩陣中的計算就只會涉及到加法，因此會讓大模型在保持一定精度的同時，顯著減少所需的存儲空間和計算資源，也顯著提升了在本地設備上運行LLM的可能性。
這個項目開源后，在X上也受到了一波高度關注。
千億參數模型量化后單CPU可跑bitnet.cpp是1bit LLM（例如 BitNet b1.58）的官方推理框架。
該框架配備了一系列優化內核，支持在CPU上進行快速且無損的1.58bit模型推理，未來將擴展支持NPU

原文鏈接：微軟開源爆火1.58bit大模型推理框架！千億參數模型量化后單CPU可跑，速度每秒5-7個token

聯系作者

文章來源：量子位
作者微信：
作者簡介：

# AIGC動態 # 參數 # 微軟 # 權重 # 框架 # 模型

? 版權聲明

文章版權歸作者所有，未經允許請勿轉載。

Trae官網

相關文章

Trae官網

暫無評論

暫無評論...

主站蜘蛛池模板：很黄很污的网站免费| 亚洲熟女www一区二区三区| 九九全国免费视频| 国产在线ts人妖免费视频| 亚洲精品无码你懂的| 成年人视频在线观看免费 | 亚洲中文字幕久久精品无码喷水| 国产精品亚洲综合| 在线a亚洲v天堂网2018| 四虎影视永久在线精品免费| 亚洲天堂在线视频| 久久精品国产免费一区| 亚洲精品动漫在线| 最近的免费中文字幕视频| 亚洲av午夜电影在线观看| 亚洲成av人在片观看| 你懂的免费在线观看| 亚洲小视频在线观看| 中文字幕无码视频手机免费看| 亚洲人av高清无码| av在线亚洲欧洲日产一区二区| 日本免费A级毛一片| 亚洲人成网站在线观看播放青青| 成人免费无码大片a毛片| 国产精品亚洲а∨无码播放不卡 | 中国亚洲呦女专区| jjzz亚洲亚洲女人| 黄网站免费在线观看| 亚洲国产成人久久| 男人的天堂亚洲一区二区三区| 老湿机一区午夜精品免费福利| 亚洲中文字幕在线乱码| 亚洲第一网站免费视频| 亚洲国产精品嫩草影院| 亚洲一区二区三区AV无码| 国产92成人精品视频免费 | 在线涩涩免费观看国产精品| 亚洲六月丁香婷婷综合| 亚洲乱码日产精品a级毛片久久| 久久免费视频精品| 国产一区二区三区亚洲综合 |

<li id="oksiq"><source id="oksiq"></source></li><bdo id="oksiq"></bdo>

<code id="oksiq"></code>