<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        突破極限:華人團(tuán)隊(duì)一行代碼助力Llama訓(xùn)練速度飆升至1.47倍!

        AIGC動態(tài)6個(gè)月前發(fā)布 量子位
        403 0 0

        避免訓(xùn)練過程中損失回升

        突破極限:華人團(tuán)隊(duì)一行代碼助力Llama訓(xùn)練速度飆升至1.47倍!

        原標(biāo)題:1行代碼改進(jìn)大模型訓(xùn)練,Llama訓(xùn)練速度提升至1.47倍,全華人團(tuán)隊(duì)出品
        文章來源:量子位
        內(nèi)容字?jǐn)?shù):3170字

        一行代碼提升大模型訓(xùn)練效率

        根據(jù)克雷西發(fā)自凹非寺量子位的報(bào)道,得州大學(xué)奧斯汀分校的四名華人學(xué)者提出了一種新的大模型訓(xùn)練優(yōu)化器——Cautious Optimizers。這一優(yōu)化器通過簡單的一行代碼修改,使得大模型的訓(xùn)練效率提升至1.47倍,同時(shí)確保訓(xùn)練效果不受影響,適用于語言與視覺模型。

        優(yōu)化器的原理

        Cautious Optimizers基于哈密頓量和下降動力學(xué)的理論,旨在加速訓(xùn)練的同時(shí)保證收斂特性。在PyTorch中,只需增加一行代碼,通過引入掩蔽機(jī)制,避免參數(shù)更新方向與當(dāng)前梯度方向相悖。具體來說,該機(jī)制通過內(nèi)積判斷參數(shù)更新與梯度方向的一致性,確保在方向不一致時(shí)跳過更新,從而減少損失函數(shù)的回升風(fēng)險(xiǎn)。

        顯著的訓(xùn)練效率提升

        研究者在600M至1B參數(shù)規(guī)模的Llama模型上進(jìn)行了實(shí)驗(yàn),結(jié)果顯示Cautious Optimizers顯著提升了訓(xùn)練效率。尤其在1B規(guī)模下,與原版AdamW和Lion相比,C-AdamW和C-Lion的樣本效率分別提高了47%和28%。同時(shí),Cautious Optimizers在所有實(shí)驗(yàn)中都表現(xiàn)出更低的困惑度,驗(yàn)證了其優(yōu)秀的泛化能力。

        在下游任務(wù)中的表現(xiàn)

        為評估模型的實(shí)際效果,研究者在6個(gè)GLUE下游任務(wù)中測試了C-AdamW的表現(xiàn),結(jié)果顯示其平均得分比AdamW高出2%,大多數(shù)任務(wù)均取得進(jìn)步,證明了該優(yōu)化器的有效性。在視覺任務(wù)方面,Cautious Optimizers同樣表現(xiàn)出色,訓(xùn)練MAE模型時(shí),C-AdamW的最終重建誤差為0.5926,低于AdamW的0.6085。

        研究團(tuán)隊(duì)背景

        該項(xiàng)目由Kaizhao Liang及其團(tuán)隊(duì)共同打造,Liang是一名高級ML工程師,其他三位研究者均為得州大學(xué)奧斯汀分校的教授及博士生。研究成果已在GitHub上開源,提供詳細(xì)的使用說明。

        論文地址與代碼庫鏈接為:論文GitHub


        聯(lián)系作者

        文章來源:量子位
        作者微信:
        作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲国产成人一区二区精品区| 亚洲综合色在线观看亚洲| 激情内射亚洲一区二区三区| av网站免费线看| 亚洲色一色噜一噜噜噜| 美女无遮挡免费视频网站| 一区二区三区亚洲视频| 免费人成在线观看播放a| 久久精品国产亚洲Aⅴ蜜臀色欲| 一道本不卡免费视频| 青青草原亚洲视频| 91视频免费观看高清观看完整| 亚洲码国产精品高潮在线| 久久这里只精品热免费99| 亚洲最新视频在线观看| 免费观看无遮挡www的视频| 香蕉大伊亚洲人在线观看| 日韩免费高清一级毛片在线| 黄色网址免费在线| 亚洲av综合av一区| 美女视频黄a视频全免费| 亚洲av日韩aⅴ无码色老头| 亚洲电影日韩精品| 成人网站免费看黄A站视频| 亚洲天堂中文字幕在线观看| 精品无码国产污污污免费| 日韩在线观看免费| 亚洲第一视频网站| 大学生一级特黄的免费大片视频| 视频一区二区三区免费观看| 亚洲人成伊人成综合网久久久| 中国xxxxx高清免费看视频| 亚洲AV无码无限在线观看不卡 | 国产aⅴ无码专区亚洲av| 久久国产乱子伦免费精品| 亚洲日韩一区二区三区| 精品国产亚洲一区二区在线观看| 蜜臀98精品国产免费观看| 麻豆va在线精品免费播放| 亚洲视频在线不卡| 国产精品亚洲不卡一区二区三区|