国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

大模型訓練或無需“純凈數據”!北大團隊新研究:隨機噪聲影響有限,新方法讓模型更抗噪

AIGC動態7個月前發布 量子位
330 0 0

在噪聲環境中依然保持強勁表現

大模型訓練或無需“純凈數據”!北大團隊新研究:隨機噪聲影響有限,新方法讓模型更抗噪

原標題:大模型訓練或無需“純凈數據”!北大團隊新研究:隨機噪聲影響有限,新方法讓模型更抗噪
文章來源:量子位
內容字數:4549字

北大團隊:大模型訓練并非必須依賴“純凈數據”

傳統的大語言模型訓練依賴于“純凈數據”,即經過仔細篩選、語確且邏輯嚴密的文本。然而,北京大學的研究團隊近期的一項研究挑戰了這一觀點,認為適量的“噪聲數據”并不會顯著影響模型性能,甚至可能帶來意想不到的益處。

  1. 核心發現:噪聲數據對大模型訓練的影響

    研究團隊通過在訓練數據中添加高達20%的隨機亂碼,訓練了多個GPT-2模型。結果顯示,即使面對如此高比例的噪聲數據,模型的Next-token Prediction (NTP) loss僅上升約1%。更令人驚訝的是,在一些下游任務測試中,含噪模型甚至表現出更低的NTP loss。這表明,傳統的“純凈數據”假設可能過于嚴格。

  2. 理論解釋:隨機噪聲與模型性能的復雜關系

    研究團隊從理論角度分析了這一現象。他們將NTP過程建模為一個分類任務,并證明了在特定條件下,隨機噪聲的存在不會改變NTP loss的全局最小值。該理論解釋了為什么多語言模型和在充滿背景噪音的數據集上訓練的音頻模型能夠成功。他們還通過實驗驗證了這一理論的正確性,包括使用高斯分布生成的噪聲。

  3. 解決方法:局部梯度匹配(LGM)損失函數

    盡管預訓練損失變化微弱,但下游任務性能卻可能受到影響。研究團隊發現,在高斯噪聲上訓練的模型,盡管NTP loss更低,但在文本分類下游任務中的準確率卻下降。為了解決這個問題,他們提出了一種名為“局部梯度匹配”(LGM)的即插即用解決方案。LGM通過在特征中添加高斯噪聲并約束原始/擾動特征的梯度差異,增強分類頭的抗噪能力,從而彌補噪聲導致的特征偏移。實驗結果表明,LGM可以顯著提升受噪聲影響的模型在下游任務中的性能,甚至在干凈模型上也能提升1%-3%的準確率。

  4. 啟示與展望:數據清洗的新思考

    這項研究為大規模預訓練提供了新的視角:首先,它表明適度保留隨機噪聲可以降低數據清洗成本;其次,它為多語言模型的成功提供了理論解釋;第三,它提出了一種新的數據增強方法,即可控噪聲注入,可以提升模型的泛化能力。然而,研究也存在局限性,例如實驗僅基于GPT-2規模模型,未來需要進一步研究超大規模模型的噪聲耐受性以及LGM在其他模態中的應用。

總而言之,北大團隊的研究挑戰了大語言模型訓練對“純凈數據”的依賴,為降低數據清洗成本、提升模型泛化能力提供了新的思路和方法。這項研究的成果具有重要的理論意義和實際應用價值。


聯系作者

文章來源:量子位
作者微信:
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

閱讀原文
? 版權聲明
蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        成人高清在线视频| 丁香一区二区三区| 日本中文字幕一区二区视频| 欧美三电影在线| 亚洲成人www| 欧美一级理论片| 国产精品中文有码| 亚洲色图欧美激情| 欧美一区中文字幕| 成人午夜激情片| 午夜影院久久久| 久久久久久久电影| 在线亚洲精品福利网址导航| 日本午夜精品一区二区三区电影| 欧美精品一区二区三区视频| 成人激情视频网站| 亚洲午夜激情网站| 久久综合一区二区| 日本电影欧美片| 美女视频免费一区| 日韩一区中文字幕| 精品国产区一区| 色婷婷激情一区二区三区| 日韩电影在线免费| 中文字幕av一区 二区| 欧美日韩不卡在线| 99精品久久只有精品| 九九热在线视频观看这里只有精品| 国产精品第四页| 91精品久久久久久久99蜜桃 | 一本色道久久综合亚洲91| 日本在线不卡一区| ㊣最新国产の精品bt伙计久久| 911国产精品| 色偷偷久久人人79超碰人人澡| 激情小说欧美图片| 三级亚洲高清视频| 一区二区在线电影| 国产精品国产三级国产有无不卡| 日韩免费高清电影| 欧美人狂配大交3d怪物一区| 99久久久国产精品| 丁香网亚洲国际| 国产精品1024| 国产综合久久久久久鬼色| 视频一区视频二区在线观看| 亚洲影院理伦片| 一区二区三区**美女毛片| 国产精品网曝门| 国产精品三级在线观看| 国产精品无遮挡| 国产精品美女久久久久久久| 久久久国产精品麻豆| 日韩欧美国产午夜精品| 欧美二区三区的天堂| 欧美日韩另类一区| 欧美日韩精品久久久| 色吧成人激情小说| 欧美日韩免费高清一区色橹橹| 欧美丝袜丝交足nylons| 色综合久久综合网97色综合 | 欧美三级日韩在线| 欧美伊人久久久久久久久影院| 在线观看视频一区二区欧美日韩| 91蜜桃免费观看视频| 日本精品裸体写真集在线观看| 91女厕偷拍女厕偷拍高清| 91在线视频官网| 欧美日韩在线播放| 日韩一区二区三区免费观看| 亚洲精品一区二区三区蜜桃下载| 久久婷婷久久一区二区三区| 国产视频一区不卡| 亚洲私人黄色宅男| 亚洲成av人片一区二区三区| 午夜电影久久久| 免播放器亚洲一区| 国产精品一二三区| 日本高清不卡视频| 精品久久人人做人人爽| 欧美激情中文字幕一区二区| 亚洲精品久久嫩草网站秘色| 亚洲国产精品麻豆| 国产一区二区三区蝌蚪| 粉嫩av一区二区三区在线播放| 99精品国产热久久91蜜凸| 国产精品午夜电影| 免费高清成人在线| 久久众筹精品私拍模特| 亚洲精品一区二区在线观看| 国产日产欧美一区| 亚洲国产精品欧美一二99| 日精品一区二区三区| 国产精品影视在线观看| 色中色一区二区| 欧美va亚洲va国产综合| 国产精品―色哟哟| 日本美女一区二区| av午夜精品一区二区三区| 欧美日韩成人在线| 亚洲人成精品久久久久久 | 免费在线成人网| 99精品视频免费在线观看| 日韩欧美中文字幕一区| 亚洲伊人伊色伊影伊综合网| 久久国产福利国产秒拍| 日本韩国一区二区三区视频| 2欧美一区二区三区在线观看视频 337p粉嫩大胆噜噜噜噜噜91av | 国产黄色91视频| 亚洲一区二区三区在线看| 欧美日韩激情一区二区三区| 日韩欧美国产三级| 亚洲国产日韩综合久久精品| 精品一区二区三区在线观看| 欧美曰成人黄网| 国产欧美一区二区精品性色超碰| 亚洲国产日韩一级| 成人一区二区三区| 精品国产99国产精品| 日本三级亚洲精品| 欧美在线观看一区| 亚洲欧美日韩综合aⅴ视频| 国产一区二区三区电影在线观看| 欧美日韩激情在线| 亚洲va欧美va人人爽午夜| 成人黄页在线观看| 久久久久高清精品| 国产在线精品国自产拍免费| 精品国产凹凸成av人网站| 日韩电影免费在线| 欧美美女视频在线观看| 亚洲乱码日产精品bd| av一区二区三区四区| 国产偷国产偷精品高清尤物| 久久久夜色精品亚洲| 另类小说色综合网站| 日韩色视频在线观看| 蜜臀av性久久久久蜜臀aⅴ| 欧美一区二区在线免费观看| 五月开心婷婷久久| 日韩欧美一二三区| 国产经典欧美精品| 国产清纯美女被跳蛋高潮一区二区久久w| 日本亚洲一区二区| 精品久久人人做人人爽| 久久不见久久见免费视频1| 欧美大片在线观看| 国产成人在线影院| 亚洲欧美精品午睡沙发| 在线一区二区视频| 日精品一区二区| 精品国产123| 成人开心网精品视频| 国产精品国产三级国产普通话99| 91香蕉视频在线| 亚洲国产aⅴ天堂久久| 在线播放/欧美激情| 精品一区二区三区影院在线午夜| 久久久久久久久久久黄色| 成人sese在线| 一区二区三区 在线观看视频| 欧美精品久久99| 久久99精品久久久久| 欧美经典一区二区| 欧美写真视频网站| 国产成人在线影院 | 欧美一区二区三级| 激情图区综合网| 综合婷婷亚洲小说| 欧美放荡的少妇| 成人免费毛片片v| 一区二区三区在线观看欧美| 欧美一级艳片视频免费观看| 国产精品一区二区三区99| 一区二区成人在线视频 | 91久久精品一区二区三| 男人的j进女人的j一区| 欧美国产日韩a欧美在线观看| 色综合久久66| 国产在线播放一区二区三区| 亚洲精品写真福利| 国产欧美日韩在线视频| 欧美色偷偷大香| 成人污视频在线观看| 五月综合激情网| 亚洲欧美偷拍另类a∨色屁股| 日韩亚洲欧美在线| 91麻豆免费看片| 国产精品综合二区| 青椒成人免费视频| 亚洲午夜日本在线观看| 国产日韩欧美高清| 精品欧美一区二区久久| 欧美亚洲国产一卡| 99精品欧美一区| 成人性生交大片| 蜜桃av一区二区在线观看| 亚洲免费伊人电影| 最新高清无码专区| 欧美国产激情二区三区|