<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        只激活3.8B參數(shù),性能比肩同款7B模型!訓練微調(diào)都能用,來自微軟

        AIGC動態(tài)10個月前發(fā)布 量子位
        385 0 0

        只激活3.8B參數(shù),性能比肩同款7B模型!訓練微調(diào)都能用,來自微軟

        AIGC動態(tài)歡迎閱讀

        原標題:只激活3.8B參數(shù),性能比肩同款7B模型!訓練微調(diào)都能用,來自微軟
        關(guān)鍵字:模型,張量,梯度,函數(shù),性能
        文章來源:量子位
        內(nèi)容字數(shù):0字

        內(nèi)容摘要:


        克雷西 發(fā)自 凹非寺量子位 | 公眾號 QbitAI只需激活60%的參數(shù),就能實現(xiàn)與全激活稠密模型相當?shù)男阅堋?br />微軟亞洲研究院的一項新研究,實現(xiàn)了模型的完全稀疏激活,讓推理成本大幅下降。
        而且適用范圍廣泛,無論是從頭訓練、繼續(xù)訓練還是微調(diào),都能提供有效支持。
        該方法名為Q-Sparse,在神經(jīng)元級別上實現(xiàn)了模型稀疏化,相比于其他方式粒度更細,在相同推理開銷下,無論性能還是稀疏率都更好。
        名稱之中,Q指的是量化(Quantization),意味著它除了普通模型之外,也兼容量化技術(shù),適用于各種量化方式的模型。
        作者進一步表示,如果把Q-Sparse與模型量化技術(shù)結(jié)合,還可以實現(xiàn)更大程度的降本增效。
        另外在研究Q-Sparse的同時,團隊也對參數(shù)規(guī)模、稀疏率和模型性能三者之間的關(guān)系進行了深入探尋,并發(fā)現(xiàn)了適用于模型推理優(yōu)化的“Scaling Law”。
        有網(wǎng)友認為,這項技術(shù)確實不錯,而且比ReLU要更好。
        還有人開啟了許愿模式,表示如果(AMD的)ROCm能比英偉達更快支持這項技術(shù)就好了。
        用Top-K函數(shù)實現(xiàn)稀疏化Q-Sparse所做的最核心的操作,是對輸入的張量應(yīng)用Top-K稀疏化函數(shù)。


        原文鏈接:只激活3.8B參數(shù),性能比肩同款7B模型!訓練微調(diào)都能用,來自微軟

        聯(lián)系作者

        文章來源:量子位
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲一区二区三区免费在线观看| 免费在线观看亚洲| 免费被黄网站在观看| 日本一区二区在线免费观看| 亚洲成AV人片在| 成年男女男精品免费视频网站 | 在线91精品亚洲网站精品成人| 亚洲无码高清在线观看| 精品无码AV无码免费专区| 亚洲丁香婷婷综合久久| 国产亚洲综合网曝门系列| 成年免费大片黄在线观看岛国| 一区在线免费观看| 亚洲国产成人精品无码区在线秒播| 国产极品粉嫩泬免费观看| 国色精品va在线观看免费视频| 亚洲日韩精品国产一区二区三区| 亚洲中文字幕无码久久2017| 国内自产拍自a免费毛片| a毛片在线免费观看| 亚洲高清乱码午夜电影网| 亚洲国产人成网站在线电影动漫 | 国产国产人免费人成免费视频| 免费人成激情视频在线观看冫| 亚洲欧美日韩综合久久久| 亚洲AV日韩精品久久久久久| 国产一级淫片免费播放| 国产成人精品久久免费动漫| a级黄色毛片免费播放视频| 亚洲av纯肉无码精品动漫| 亚洲精品一卡2卡3卡三卡四卡| 亚洲中文字幕伊人久久无码| 在线观看人成视频免费| 67pao强力打造高清免费| 免费人成视频x8x8入口| 免费看片在线观看| 免费国产叼嘿视频大全网站| 九九全国免费视频| 国产亚洲精品美女| 亚洲熟女综合一区二区三区| 亚洲男女性高爱潮网站|