<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        時隔6年BERT升級!僅編碼器架構沒被,更快更準確更長上下文

        AIGC動態5個月前發布 量子位
        543 0 0

        抱抱臉CEO:愛了!!

        時隔6年BERT升級!僅編碼器架構沒被殺死,更快更準確更長上下文

        原標題:時隔6年BERT升級!僅編碼器架構沒被,更快更準確更長上下文
        文章來源:量子位
        內容字數:4640字

        ModernBERT:BERT的現代復興

        時隔六年,一度被認為瀕死的BERT模型迎來了它的現代化版本——ModernBERT。這款由Answer.AI和LightOn團隊開發的模型,在速度、精度和上下文長度方面都實現了顯著提升,并在多個基準測試中取得了SOTA成績,其開源發布也引發了廣泛關注。

        ModernBERT的優勢

        1. 速度與效率:ModernBERT的速度是DeBERTa的兩倍,在更常見的輸入長度混合情況下,速度可達四倍;長上下文推理速度提升約三倍,同時內存占用不到DeBERTa的五分之一。
        2. 精度與性能:在信息檢索(RAG)、分類、實體抽取等任務中取得了SOTA性能。
        3. 更長的上下文:支持8192個token的上下文長度,是傳統BERT的16倍。
        4. encoder-only架構:能夠同時考慮前后文信息,克服了decoder-only模型只能“向后看”的限制。

        作者Jeremy Howard認為,當前生成式模型的熱潮掩蓋了encoder-only模型的價值。大型生成式模型(如GPT-4)存在成本高、速度慢、私有化等問題,并不適用于所有任務。而ModernBERT憑借其高效性和強大的性能,為許多實際應用提供了更優的選擇。

        ModernBERT的現代化升級

        ModernBERT的“現代”體現在三個方面:現代化的Transformer架構、現代數據規模與來源,以及高效的訓練策略。

        1. 現代化的Transformer架構:ModernBERT采用了改進后的Transformer++架構(受Llama2啟發),主要改進包括:使用旋轉位置嵌入(RoPE)、GeGLU層替換MLP層、移除不必要的偏置項、在嵌入層后添加歸一化層,以及利用Flash Attention 2優化計算效率。
        2. 現代數據規模與來源:ModernBERT的訓練數據規模達2萬億token,涵蓋網絡文檔、編程代碼和科學文章等多種來源,并避免了以往模型中數據重復的問題。
        3. 高效的訓練策略:ModernBERT采用三階段訓練,包括基礎訓練、長上下文適應和退火處理。同時,團隊還使用了學習率調整、batch-size warmup以及基于ModernBERT-base模型權重的“平鋪”擴展等技術來加速訓練。

        團隊與未來展望

        ModernBERT由Answer.AI和LightOn團隊開發,核心成員包括Benjamin Warner、Antoine Chaffin和Benjamin ClaviéOn。團隊表示,將公開模型權重,支持后續研究,并計劃明年訓練更大版本的ModernBERT。

        總而言之,ModernBERT的出現為encoder-only模型注入了新的活力,證明了其在特定任務中的競爭力,也為未來AI模型的發展提供了新的方向。


        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 永久黄网站色视频免费直播| 99久久人妻精品免费二区| 大陆一级毛片免费视频观看| 亚洲国产精品成人精品软件 | 亚洲久本草在线中文字幕| caoporm超免费公开视频| 亚洲人成无码网WWW| 一区二区三区在线免费观看视频| 免费国产a国产片高清网站| 美女黄网站人色视频免费| 婷婷综合缴情亚洲狠狠尤物| 午夜不卡AV免费| 亚洲性在线看高清h片| 97在线免费视频| 中文字幕在线观看亚洲| 国产人在线成免费视频| 99久久精品日本一区二区免费 | 亚洲av区一区二区三| 国产特黄一级一片免费| 亚洲精品无码Av人在线观看国产| 无码人妻久久一区二区三区免费| 深夜国产福利99亚洲视频| 久久免费观看视频| 久久夜色精品国产噜噜亚洲AV| 美女视频黄a视频全免费| 国产免费av片在线看| youjizz亚洲| 国产免费无码AV片在线观看不卡| 亚洲国产精品无码久久一线| aⅴ在线免费观看| 亚洲成A人片777777| 黄色永久免费网站| 亚洲成AV人片在WWW| 美腿丝袜亚洲综合| 精品无码人妻一区二区免费蜜桃| 亚洲一区在线免费观看| 全亚洲最新黄色特级网站| 3344在线看片免费| 亚洲日产乱码一二三区别| 国产亚洲大尺度无码无码专线 | 日本免费高清一本视频|