<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        陳丹琦團隊降本又來了:數據砍掉三分之一,性能卻完全不減

        AIGC動態6個月前發布 量子位
        272 0 0

        首次用元數據加速預訓練

        陳丹琦團隊降本大法又來了:數據砍掉三分之一,性能卻完全不減

        原標題:陳丹琦團隊降本又來了:數據砍掉三分之一,性能卻完全不減
        文章來源:量子位
        內容字數:3463字

        陳丹琦團隊新研究:元數據加速大模型預訓練,數據量減少三分之一性能不減

        普林斯頓大學陳丹琦團隊提出了一種名為MeCo(Metadata Conditioning then Cooldown)的新型大模型預訓練方法,通過引入元數據,在減少訓練數據量的同時,提升了模型性能。該方法在不同模型規模(600M-8B)和數據源上均取得了顯著效果,平均性能與使用240B標記的基線相當,而數據量卻減少了33%。

        1. MeCo方法的核心:元數據調節與冷卻

        MeCo方法包含兩個階段:預訓練階段和冷卻階段。在預訓練階段(占90%),將元數據(例如文檔URL的絕對域名)與文檔拼接進行訓練。研究人員只計算文檔標記的交叉熵損失,忽略元數據標記的損失,因為實驗表明這有助于提升下游性能。冷卻階段(占10%)使用標準數據進行訓練,并繼承預訓練階段的學習率和優化器狀態。此階段的關鍵改進包括:禁用跨文檔Attention以加速訓練并提升性能;確保每個序列從一個新文檔開始,避免數據浪費并提升性能。

        2. 實驗結果與貢獻

        實驗使用了Llama Transformer架構和Llama-3 tokenizer,在四種不同模型規模(600M、1.6B、3B和8B)上進行了測試。結果表明,MeCo顯著優于標準預訓練方法,在減少33%數據量的情況下,達到了相同的平均下游性能。該團隊總結了MeCo的三大貢獻:

        1. 顯著加速預訓練:MeCo使1.6B模型在少用33%訓練數據的情況下,達到與標準預訓練模型相同的平均下游性能,并在不同模型規模和數據源下都展現出一致的優勢。
        2. 開啟語言模型訓練新方法:MeCo能夠根據元數據引導模型學習,例如使用特定網站的URL可以提升特定任務的性能,例如常識性問題解答或降低毒性生成。
        3. MeCo設計選擇的消解和兼容性:研究證明MeCo與不同類型的元數據兼容,元數據的主要作用是按來源對文檔進行分類。

        3. 團隊成員及背景

        該論文的主要作者來自普林斯頓大學自然語言處理小組,包括博士生高天宇(一作,清華大學本科畢業,清華特獎獲得者)、Alexander Wettig、Luxi He、YiHe Dong、Sadhika Malladi以及教授陳丹琦。團隊成員在自然語言處理和機器學習領域擁有豐富的經驗。

        4. 總結

        MeCo方法通過巧妙地利用元數據,有效地提高了大模型預訓練的效率,并降低了訓練成本。這項研究為大模型的訓練和應用提供了新的思路,具有重要的學術意義和應用價值。


        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 中文字幕乱码一区二区免费| 亚洲爆乳无码精品AAA片蜜桃| 丁香花在线观看免费观看图片| 免费A级毛片无码久久版| 亚洲精品第一国产综合亚AV| 成人免费在线观看网站| 亚洲精品无码av中文字幕| 免费看的一级毛片| 国产精品无码亚洲精品2021| 免费看国产精品麻豆| 新最免费影视大全在线播放| 国产偷国产偷亚洲清高动态图| 精品免费久久久久国产一区| 亚洲自偷自偷偷色无码中文| 精品国产污污免费网站| 亚洲第一页在线播放| 国产一精品一AV一免费孕妇| 亚洲高清一区二区三区电影 | 国产精品亚洲一区二区三区在线观看| 日韩免费高清视频网站| 男女交性无遮挡免费视频| 国产亚洲综合网曝门系列| 18级成人毛片免费观看| 亚洲成av人片天堂网无码】| 亚洲区不卡顿区在线观看| 黄色网址在线免费| 亚洲自偷自偷在线成人网站传媒| 免费国内精品久久久久影院| 在线观看肉片AV网站免费 | 国内精品久久久久影院亚洲| 国产真人无遮挡作爱免费视频 | 国产精品免费在线播放| 久久亚洲精品成人av无码网站| 成年女人18级毛片毛片免费 | 亚洲系列国产精品制服丝袜第| 成人免费看片又大又黄| www.xxxx.com日本免费| 亚洲国产精品综合福利专区| 免费看国产一级特黄aa大片| 99久久国产免费-99久久国产免费| 亚洲精品av无码喷奶水糖心|