<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        LoRA數學編程任務不敵全量微調 | 哥大&Databricks新研究

        AIGC動態1年前 (2024)發布 量子位
        287 0 0

        LoRA數學編程任務不敵全量微調 | 哥大&Databricks新研究

        AIGC動態歡迎閱讀

        原標題:LoRA數學編程任務不敵全量微調 | 哥大&Databricks新研究
        關鍵字:矩陣,任務,模型,作者,權重
        文章來源:量子位
        內容字數:5854字

        內容摘要:


        克雷西 發自 凹非寺量子位 | 公眾號 QbitAI大數據巨頭Databricks與哥倫比亞大學最新研究發現,在數學和編程任務上,LoRA干不過全量微調。
        具體來說,在這兩種任務中,LoRA模型的精確度只有后者的八到九成左右。
        不過,作者也發現,LoRA雖然學得少,但是“記憶力”卻更好,遺忘現象要比全量微調少得多。
        究其原因,作者認為是數學和代碼任務的特性與LoRA的低秩“八字不合”,遺忘更少也與秩相關。
        但LoRA的一個公認的優勢是訓練成本更低;而且相比全量微調,能夠更好地保持原有模型性能。
        于是,網友們的看法也自然地分成了兩派:
        一波人認為,單純考慮降低成本用LoRA,表現卻顯著降低,這是不可接受的。
        更具針對性的,有人指出,對于數學和代碼這樣對精度要求高的任務,一定要最大程度地保證性能,哪怕犧牲一些訓練成本。
        另一波機器學習工程師則認為,作者的一些實驗參數設置不當,造成這種現象的原因不一定是LoRA本身。
        質疑的具體理由我們放到后面詳細講解,先來看看作者的研究都有哪些發現。
        學的更少,但忘的也少實驗中,作者使用7B參數的Llama2作為基礎模型,在持續預訓練和監督微調兩種模式下分


        原文鏈接:LoRA數學編程任務不敵全量微調 | 哥大&Databricks新研究

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 中文字幕亚洲码在线| 久久亚洲AV无码精品色午夜麻豆| 亚洲欧洲另类春色校园网站| 免费无码毛片一区二区APP| 亚洲日韩精品无码一区二区三区| 男人扒开添女人下部免费视频 | 精品一区二区三区免费毛片爱| 亚洲一区二区三区在线观看精品中文| 美女裸免费观看网站| 免费不卡中文字幕在线| 亚洲Av永久无码精品一区二区| 麻豆国产入口在线观看免费 | 亚洲综合久久一本伊伊区| 黄色片在线免费观看| 亚洲日日做天天做日日谢| 女人让男人免费桶爽30分钟| 亚洲AV香蕉一区区二区三区| 无码国模国产在线观看免费| 成年大片免费视频播放一级| 中文字幕亚洲天堂| 少妇性饥渴无码A区免费 | 亚洲成AV人片在WWW| 国产一级一片免费播放i| 成人国产网站v片免费观看| 国产AⅤ无码专区亚洲AV| 在线涩涩免费观看国产精品| 亚洲视频国产精品| 在线jyzzjyzz免费视频| eeuss影院www天堂免费| 久久精品亚洲一区二区 | 大片免费观看92在线视频线视频| 亚洲日韩欧洲乱码AV夜夜摸| 精品无码国产污污污免费网站| 亚洲伊人久久大香线蕉影院| 免费国产真实迷j在线观看| 中文字幕在线视频免费| 亚洲国产精品美女| 亚洲AV无码一区二三区| 永久免费视频网站在线观看| 亚洲免费视频观看| 国产精品亚洲lv粉色|