<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        LoRA數學編程任務不敵全量微調 | 哥大&Databricks新研究

        AIGC動態12個月前發布 量子位
        276 0 0

        LoRA數學編程任務不敵全量微調 | 哥大&Databricks新研究

        AIGC動態歡迎閱讀

        原標題:LoRA數學編程任務不敵全量微調 | 哥大&Databricks新研究
        關鍵字:矩陣,任務,模型,作者,權重
        文章來源:量子位
        內容字數:5854字

        內容摘要:


        克雷西 發自 凹非寺量子位 | 公眾號 QbitAI大數據巨頭Databricks與哥倫比亞大學最新研究發現,在數學和編程任務上,LoRA干不過全量微調。
        具體來說,在這兩種任務中,LoRA模型的精確度只有后者的八到九成左右。
        不過,作者也發現,LoRA雖然學得少,但是“記憶力”卻更好,遺忘現象要比全量微調少得多。
        究其原因,作者認為是數學和代碼任務的特性與LoRA的低秩“八字不合”,遺忘更少也與秩相關。
        但LoRA的一個公認的優勢是訓練成本更低;而且相比全量微調,能夠更好地保持原有模型性能。
        于是,網友們的看法也自然地分成了兩派:
        一波人認為,單純考慮降低成本用LoRA,表現卻顯著降低,這是不可接受的。
        更具針對性的,有人指出,對于數學和代碼這樣對精度要求高的任務,一定要最大程度地保證性能,哪怕犧牲一些訓練成本。
        另一波機器學習工程師則認為,作者的一些實驗參數設置不當,造成這種現象的原因不一定是LoRA本身。
        質疑的具體理由我們放到后面詳細講解,先來看看作者的研究都有哪些發現。
        學的更少,但忘的也少實驗中,作者使用7B參數的Llama2作為基礎模型,在持續預訓練和監督微調兩種模式下分


        原文鏈接:LoRA數學編程任務不敵全量微調 | 哥大&Databricks新研究

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲精品成人网久久久久久| 拍拍拍又黄又爽无挡视频免费| jizzjizz亚洲| 麻豆亚洲AV成人无码久久精品| 成人免费视频网址| 亚洲av乱码一区二区三区按摩| 成年人免费视频观看| 亚洲乱色熟女一区二区三区蜜臀| 毛片免费视频在线观看| 亚洲综合在线一区二区三区| 久久久久久久久免费看无码| 黑人粗长大战亚洲女2021国产精品成人免费视频 | 亚洲色精品vr一区二区三区| 九九热久久免费视频| 香蕉视频在线观看亚洲| 真人做人试看60分钟免费视频 | 亚洲一区二区在线视频| 国内精品免费麻豆网站91麻豆| 成人区精品一区二区不卡亚洲| 日本v片免费一区二区三区| 免费无码国产在线观国内自拍中文字幕| 亚洲第一成人影院| 色播在线永久免费视频网站| 亚洲视频一区网站| 在线观看亚洲免费| 在线毛片片免费观看| 亚洲国产美女视频| 国产国产成年年人免费看片| 国产精品午夜免费观看网站| 久久精品国产亚洲精品2020| 四虎免费在线观看| 国产一区二区三区免费观在线 | 色婷婷亚洲一区二区三区| 国产亚洲精品精品国产亚洲综合| 99国产精品免费视频观看| 亚洲影院天堂中文av色| 精品国产日韩亚洲一区| 麻豆国产精品免费视频| 黄色毛片免费网站| 亚洲中文无码av永久| 亚洲日本在线观看视频|