<label id="3dn8r"><mark id="3dn8r"></mark></label>

<span id="3dn8r"></span>

<span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

<strike id="uawsy"></strike>

<rt id="uawsy"></rt>

<abbr id="uawsy"><tbody id="uawsy"></tbody></abbr>

<li id="uawsy"><tbody id="uawsy"></tbody></li>

<bdo id="uawsy"><source id="uawsy"></source></bdo>

<cite id="uawsy"></cite>

微軟6頁論文爆火：三進制LLM，真香！

AIGC動態1年前 (2024)發布量子位

482 0 0

AIGC動態歡迎閱讀

原標題：微軟6頁論文爆火：三進制LLM，真香！
關鍵字：騰訊,知乎,模型,參數,權重
文章來源：量子位
內容字數：4590字

內容摘要：

金磊發自凹非寺量子位 | 公眾號 QbitAI現在，大語言模型（LLM）迎來了“1-bit時代”。
這就是由微軟和中國中科院大學在最新一項研究中所提出的結論——
所有的LLM，都將是1.58 bit的。
具體而言，這項研究提出的方法叫做BitNet b1.58，可以說是從大語言模型“根兒”上的參數下手。
將傳統以16位浮點數（如FP16或BF16）形式的存儲，統統變成了三進制，也就是{-1, 0, 1}。
值得注意的是，這里的“1.58 bit”并不是指每個參數占用1.58字節的存儲空間，而是指每個參數可以用1.58位的信息來表示。
在如此轉換之后，矩陣中的計算就只會涉及到整數的加法，因此會讓大模型在保持一定精度的同時，顯著減少所需的存儲空間和計算資源。
例如BitNet b1.58在3B模型大小時與Llama做比較，速度提高了2.71倍的同時，GPU內存使用幾乎僅是原先的四分之一。
而且當模型的規模越大時（例如70B），速度上的提升和內存上的節省就會更加顯著！
這種顛覆傳統的思路著實是讓網友們眼前一亮，論文在X上也是受到了高度的關注：
網友們驚嘆“改變游戲規則”的同時，還玩起了谷

原文鏈接：微軟6頁論文爆火：三進制LLM，真香！

聯系作者

文章來源：量子位
作者微信：QbitAI
作者簡介：追蹤人工智能新趨勢，關注科技行業新突破

# AIGC動態 # 參數 # 權重 # 模型 # 知乎 # 騰訊

? 版權聲明

文章版權歸作者所有，未經允許請勿轉載。

Trae官網

相關文章

Trae官網

暫無評論

暫無評論...

主站蜘蛛池模板：亚美影视免费在线观看| 无码免费一区二区三区免费播放| 永久免费毛片在线播放| 亚洲女人被黑人巨大进入| 亚洲aⅴ无码专区在线观看| 暖暖免费高清日本一区二区三区| 亚洲色精品三区二区一区| 国产亚洲精AA在线观看SEE| 免费人成动漫在线播放r18 | 亚洲中文无码永久免费| 久久久久久久91精品免费观看| 亚洲国产片在线观看| 国产人在线成免费视频| 亚洲jizzjizz少妇| 免费播放特黄特色毛片| XXX2高清在线观看免费视频| 国产亚洲精品岁国产微拍精品| 免费毛片a线观看| 亚洲国产精品综合久久网各| 成人免费777777| 在线观看永久免费视频网站| 亚洲AV网一区二区三区| 国产成人高清亚洲| 一区二区三区在线免费看| 国产成人精品日本亚洲专一区| 曰批全过程免费视频在线观看无码| 亚洲AV午夜成人片| 99久久免费精品国产72精品九九 | www.xxxx.com日本免费| 97se亚洲综合在线| 国产美女精品久久久久久久免费| 一出一进一爽一粗一大视频免费的| 国产V亚洲V天堂A无码| 久久经典免费视频| 免费观看四虎精品成人| 亚洲国产精品久久久久网站 | 亚洲精品私拍国产福利在线| 免费无码又黄又爽又刺激| 深夜免费在线视频| 亚洲国产成人91精品| 亚洲爽爽一区二区三区|

<button id="ysums"></button><rt id="ysums"><pre id="ysums"></pre></rt>

<button id="ysums"><input id="ysums"></input></button>

<code id="ysums"><tr id="ysums"></tr></code>