<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        低精度只適用于未充分訓練的LLM?騰訊提出LLM量化的scaling laws

        AIGC動態4個月前發布 機器之心
        544 0 0

        本文介紹了一套針對于低比特量化的 scaling laws。

        低精度只適用于未充分訓練的LLM?騰訊提出LLM量化的scaling laws

        原標題:低精度只適用于未充分訓練的LLM?騰訊提出LLM量化的scaling laws
        文章來源:機器之心
        內容字數:5625字

        騰訊AI Lab挑戰低比特量化:充分訓練的LLM量化損失巨大

        本文總結了騰訊AI Lab發表在arXiv上的一篇論文,該論文挑戰了低比特量化在大型語言模型(LLM)中的普遍適用性。研究發現,低比特量化僅在未充分訓練的LLM上才能取得與fp16/bf16精度相當的性能,隨著訓練的深入,性能差距會顯著擴大。

        1. 低比特量化的局限性

        近年來,低比特量化因其能夠在降低模型規模、內存占用和計算資源的同時保持性能而備受關注。然而,騰訊AI Lab的研究表明,這種優勢只存在于訓練數據量較少的LLM中(通常小于5000億tokens)。當模型充分訓練后,低比特量化會導致顯著的性能下降。

        2. 實驗設計與數據分析

        研究人員對超過1500個不同大小和訓練程度的開源LLM檢查點進行了量化實驗,分析了量化引起的性能退化(QiD)。實驗使用了Pythia系列模型,涵蓋了不同尺寸(160M到12B參數)和訓練階段的檢查點。通過GPTQ對這些檢查點進行2-bit,3-bit,4-bit量化,并觀察QiD的變化。

        研究人員發現,在模型大小固定的情況下,訓練數據量越多,QiD越大;在訓練數據量固定的情況下,模型越小,QiD越大。這表明充分訓練的模型更容易受到低比特量化的負面影響。

        3. 低比特量化的Scaling Laws

        基于實驗結果,研究人員推導出一套低比特量化的scaling laws,該公式可以預測不同大小和訓練程度的LLM在低比特量化下的性能損失:?qLoss = k * Nα * Dβ * Pγ 。其中,N為模型參數量,D為訓練數據量,P為量化精度(比特數),α、β、γ為正數指數,k為聯合系數。

        該公式表明,更大的模型(N)、更低的精度(P)會導致更小的QiD,而更大的訓練數據量(D)會導致更大的QiD。

        4. 權重變化與模型訓練程度

        研究人員認為,未充分訓練的LLM權重變化幅度較大,對權重變化更魯棒,因此低比特量化造成的偏差較小。而充分訓練的LLM權重變化較小,低比特量化帶來的額外變化更容易導致性能下降。

        5. QiD作為衡量訓練充分程度的指標

        研究人員提出,QiD可以作為衡量LLM訓練是否充分的指標。QiD接近0表明模型尚未充分訓練,還有提升空間。利用scaling laws,可以預測不同尺寸的LLM達到指定QiD所需的訓練數據量。

        6. 對原生低比特LLM的討論

        研究也涵蓋了原生低比特LLM,發現其規律與低比特量化類似,但性能下降可能在更晚的訓練階段才會顯現。

        7. 結論與展望

        研究強調了在未充分訓練的LLM上進行實驗的局限性,呼吁社區重新審視基于此類實驗得出的結論。隨著模型訓練數據量的不斷增加,低比特量化在未來應用中的前景可能并不樂觀。


        聯系作者

        文章來源:機器之心
        作者微信:
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲综合伊人制服丝袜美腿| 又大又黄又粗又爽的免费视频| 免费精品久久天干天干| 国内少妇偷人精品视频免费| 中文字幕亚洲免费无线观看日本 | 国产一级淫片a免费播放口之 | 亚洲人成人77777网站不卡| 亚洲欧美成人综合久久久| 国产免费A∨在线播放| 57pao一国产成永久免费| 五月婷婷亚洲综合| 亚洲小说图片视频| 日韩在线视频免费| 最近中文字幕国语免费完整| 亚洲精品国产福利片| 一级成人生活片免费看| 免费高清小黄站在线观看| 国产精品亚洲精品日韩已满| 亚洲s码欧洲m码吹潮| 100部毛片免费全部播放完整| 亚洲酒色1314狠狠做| 久久久久久噜噜精品免费直播| 亚洲精品无码专区久久同性男| 亚洲人成影院午夜网站| 四虎免费在线观看| 亚洲av永久无码精品三区在线4 | 亚洲乱码在线卡一卡二卡新区| 午夜免费福利片观看| 亚洲第一区在线观看| 亚洲国产精品无码久久98| 亚洲精品第一国产综合境外资源 | 日韩毛片一区视频免费| 亚洲第一成年免费网站| 亚洲国产成人久久综合碰碰动漫3d | 亚洲系列中文字幕| 女人被免费视频网站| 成人无码区免费A∨直播| 亚洲一区二区三区在线播放| 亚洲国产精品99久久久久久| 亚洲熟妇丰满多毛XXXX| 污视频网站免费观看|