<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        50s完成7B模型量化,4bit達到新SOTA,大模型低比特量化有新招了 | NeurIPS 2024 Oral

        AIGC動態(tài)10個月前發(fā)布 量子位
        579 0 0

        50s完成7B模型量化,4bit達到新SOTA,大模型低比特量化有新招了 | NeurIPS 2024 Oral

        AIGC動態(tài)歡迎閱讀

        原標(biāo)題:50s完成7B模型量化,4bit達到新SOTA,大模型低比特量化有新招了 | NeurIPS 2024 Oral
        關(guān)鍵字:矩陣,權(quán)重,模型,通道,作者
        文章來源:量子位
        內(nèi)容字?jǐn)?shù):0字

        內(nèi)容摘要:


        DuQuant團隊 投稿量子位 | 公眾號 QbitAI消除激活值(outliers),大語言模型低比特量化有新招了——
        自動化所、清華、港城大團隊最近有一篇論文入選了NeurIPS 2024(Oral Presentation),他們針對LLM權(quán)重激活量化提出了兩種正交變換,有效降低了outliers現(xiàn)象,達到了4-bit的新SOTA。
        簡單理解,在大語言模型(LLM)中,有一些中間層輸出的數(shù)值(激活值 Activation)會變得非常大,它們被稱為“outliers(離群值)”,這些 outliers給模型量化帶來了挑戰(zhàn)。
        補充一下,量化可以將模型中的數(shù)值從浮點數(shù)轉(zhuǎn)換為整數(shù),以減少模型的大小和計算需求。
        而一旦在量化過程中存在大量outliers,會導(dǎo)致量化后的模型性能下降。
        明白了這層道理, 我們再來看他們團隊的一項名為DuQuant的新研究。
        首先, 他們發(fā)現(xiàn)在LLM的前饋網(wǎng)絡(luò) (FFN) 模塊中的down_proj層, 存在明顯的Massive Outliers(非常大的激活值)。
        這種outliers不同于以往發(fā)現(xiàn)的Normal Outliers,表現(xiàn)為大于絕對值幾百的異常


        原文鏈接:50s完成7B模型量化,4bit達到新SOTA,大模型低比特量化有新招了 | NeurIPS 2024 Oral

        聯(lián)系作者

        文章來源:量子位
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产亚洲精品一品区99热| 69精品免费视频| 日本高清在线免费| 亚洲AV蜜桃永久无码精品| 久久亚洲精品国产精品婷婷| 久久免费公开视频| 伊人久久亚洲综合| 人人鲁免费播放视频人人香蕉| 国产成人免费高清激情明星| 色综合久久精品亚洲国产| 91视频国产免费| 亚洲人成高清在线播放| 色欲A∨无码蜜臀AV免费播 | 亚洲精品高清国产一线久久| 四虎在线免费视频| igao激情在线视频免费| 亚洲一区无码精品色| 乱淫片免费影院观看| 国产成人免费手机在线观看视频| 亚洲日韩看片无码电影| 精品久久久久久久免费人妻| 亚洲最大的成人网站| 国产一级大片免费看| eeuss影院免费92242部| 亚洲日韩中文字幕| 国产成人精品免费视频大全五级 | 国产偷国产偷亚洲高清在线| 免费在线观看视频a| 抽搐一进一出gif免费视频| 国产亚洲综合一区柠檬导航| 日韩毛片无码永久免费看| 美女尿口扒开图片免费| 国产成人亚洲精品狼色在线| 成人性生交大片免费看无遮挡| 国产亚洲福利一区二区免费看| 亚洲理论片在线观看| 国产又粗又猛又爽又黄的免费视频 | 国产精品免费看久久久无码| 久久国产高潮流白浆免费观看| 一级毛片在线完整免费观看| 亚洲AV无码AV男人的天堂不卡|