<label id="3dn8r"><mark id="3dn8r"></mark></label>

<span id="3dn8r"></span>

<span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

如何解決大模型增量預訓練中的災難性遺忘？

AIGC動態1年前 (2024)發布算法邦

662 0 0

如何解決大模型增量預訓練中的災難性遺忘？

AIGC動態歡迎閱讀

原標題：如何解決大模型增量預訓練中的災難性遺忘？
關鍵字：模型,增量,數據,領域,方法
文章來源：算法邦
內容字數：5208字

內容摘要：

目前不少開源模型在通用領域具有不錯的效果，但由于缺乏領域數據，往往在一些垂直領域中表現不理想，這時就需要增量預訓練和微調等方法來提高模型的領域能力。
但在領域數據增量預訓練或微調時，很容易出現災難性遺忘現象，也就是學會了垂直領域知識，但忘記了通用領域知識。
今天給大家帶來一篇增量預訓練方法-Llama-Pro，對LLMs進行Transformer塊擴展后，增量預訓練過程中僅對新增塊進行訓練，有效地進行模型知識注入，并且極大程度地避免災難性遺忘。
LLaMA Pro: Progressive LLaMA with Block Expansion
LLaMAPro:ProgressiveLLaMAwithBlockExpansion
Paper:https://arxiv.org/abs/2401.02415
Github:https://github.com/TencentARC/LLaMA-Pro
01塊擴展方法塊擴展，顧名思義，就是在原始模型中每個Transformer塊或者某幾個Transformer塊后增加一個Transformer塊，但為了保持擴展后的模型輸出保持不變，需要增加

原文鏈接：如何解決大模型增量預訓練中的災難性遺忘？

聯系作者

文章來源：算法邦
作者微信：allplusai
作者簡介：「算法邦」，隸屬于智猩猩，關注大模型、生成式AI、計算機視覺三大領域的研究與開發，提供技術文章、講座、在線研討會。

# AIGC動態 # 增量 # 數據 # 方法 # 模型 # 領域

? 版權聲明

文章版權歸作者所有，未經允許請勿轉載。

Trae官網

相關文章

Trae官網

暫無評論

暫無評論...

主站蜘蛛池模板：国产天堂亚洲国产碰碰| 亚洲影视自拍揄拍愉拍| 五月天婷婷精品免费视频| 国内大片在线免费看| 亚洲中文字幕无码一去台湾| 4444www免费看| 亚洲码一区二区三区| 亚洲精品视频在线观看免费| 亚洲欧洲国产精品久久| 免费精品国偷自产在线在线 | 一级黄色免费大片| 日本特黄特黄刺激大片免费| 亚洲av色香蕉一区二区三区蜜桃| 国产色爽免费视频| 一级特黄录像视频免费| 亚洲VA中文字幕无码一二三区 | 国产91免费在线观看| 亚洲a∨无码男人的天堂| 国产99视频精品免费观看7| 日韩亚洲不卡在线视频中文字幕在线观看| 999在线视频精品免费播放观看| 激情综合亚洲色婷婷五月| 日本最新免费不卡二区在线| 美女露100%胸无遮挡免费观看 | 亚洲成人黄色网址| 日本免费一区二区三区最新vr| 老湿机一区午夜精品免费福利| 亚洲午夜精品一级在线播放放| 国产免费网站看v片在线| 色噜噜综合亚洲av中文无码| 国拍在线精品视频免费观看| 国产精品亚洲天堂| 久久精品国产精品亚洲精品| 在线观看免费中文视频| 色噜噜噜噜亚洲第一| 国产精一品亚洲二区在线播放| 成年人视频免费在线观看| 男性gay黄免费网站| 亚洲人成依人成综合网| 成人a免费α片在线视频网站 | 99精品视频免费观看|