<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        LoRA數學編程任務不敵全量微調 | 哥大&Databricks新研究

        AIGC動態12個月前發布 量子位
        276 0 0

        LoRA數學編程任務不敵全量微調 | 哥大&Databricks新研究

        AIGC動態歡迎閱讀

        原標題:LoRA數學編程任務不敵全量微調 | 哥大&Databricks新研究
        關鍵字:矩陣,任務,模型,作者,權重
        文章來源:量子位
        內容字數:5854字

        內容摘要:


        克雷西 發自 凹非寺量子位 | 公眾號 QbitAI大數據巨頭Databricks與哥倫比亞大學最新研究發現,在數學和編程任務上,LoRA干不過全量微調。
        具體來說,在這兩種任務中,LoRA模型的精確度只有后者的八到九成左右。
        不過,作者也發現,LoRA雖然學得少,但是“記憶力”卻更好,遺忘現象要比全量微調少得多。
        究其原因,作者認為是數學和代碼任務的特性與LoRA的低秩“八字不合”,遺忘更少也與秩相關。
        但LoRA的一個公認的優勢是訓練成本更低;而且相比全量微調,能夠更好地保持原有模型性能。
        于是,網友們的看法也自然地分成了兩派:
        一波人認為,單純考慮降低成本用LoRA,表現卻顯著降低,這是不可接受的。
        更具針對性的,有人指出,對于數學和代碼這樣對精度要求高的任務,一定要最大程度地保證性能,哪怕犧牲一些訓練成本。
        另一波機器學習工程師則認為,作者的一些實驗參數設置不當,造成這種現象的原因不一定是LoRA本身。
        質疑的具體理由我們放到后面詳細講解,先來看看作者的研究都有哪些發現。
        學的更少,但忘的也少實驗中,作者使用7B參數的Llama2作為基礎模型,在持續預訓練和監督微調兩種模式下分


        原文鏈接:LoRA數學編程任務不敵全量微調 | 哥大&Databricks新研究

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 最近高清中文字幕免费| 无遮挡国产高潮视频免费观看| 久久免费国产精品一区二区| 亚洲欧洲久久久精品| 青青草97国产精品免费观看| 日韩亚洲国产二区| 一级做a爰黑人又硬又粗免费看51社区国产精品视 | 亚洲最大的成人网站| 成人免费午夜无码视频| 亚洲免费福利在线视频| 暖暖免费高清日本中文| 美女又黄又免费的视频| 亚洲中文无韩国r级电影| 日韩精品无码免费专区午夜 | 91久久亚洲国产成人精品性色 | 午夜免费福利影院| 精品成人一区二区三区免费视频| 国产伦一区二区三区免费| 国产人成网在线播放VA免费| 亚洲Aⅴ无码专区在线观看q| 久久久久久精品免费看SSS| 亚洲中文无码卡通动漫野外| 波多野结衣免费视频观看| 黄色网站软件app在线观看免费| 亚洲AV人无码激艳猛片| 无码中文字幕av免费放| 一级午夜a毛片免费视频| 久久精品国产亚洲av麻豆| 成人女人A级毛片免费软件 | 亚洲伊人久久大香线焦| 国产a不卡片精品免费观看| 国产一二三四区乱码免费| 亚洲免费网站在线观看| 国产男女猛烈无遮挡免费视频网站| 成年网站免费入口在线观看 | 亚洲成色在线综合网站 | 中文字幕亚洲激情| 114一级毛片免费| 一级中文字幕免费乱码专区| 精品日韩亚洲AV无码| 国产又粗又猛又爽又黄的免费视频 |