<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2

        AIGC動態1年前 (2024)發布 新智元
        566 0 0

        革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2

        AIGC動態歡迎閱讀

        原標題:新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2
        關鍵字:架構,上下文,模型,數據,任務
        文章來源:新智元
        內容字數:5525字

        內容摘要:


        新智元報道編輯:桃子 好困
        【新智元導讀】Transformer王座即將被取而代之!Meta、USC、CMU和UCSD聯合提出了性新架構Megalodon,能夠處理無限上下文,在2萬億token訓練任務中,性能超越Llama2-7B實現了非凡的效率。繼Mamba之后,又一敢于挑戰Transformer的架構誕生了!
        來自Meta、南加州大學(USC)、CMU和UCSD的研究人員提出了全新的神經網絡架構——Megalodon(巨齒鯊)。
        這是專為有效處理「無限上下文」長度的LLM預訓練,以及推理而設計的架構。
        論文地址:https://arxiv.org/abs/2404.08801
        我們都知道,Transformer架構個在處理長上下文時,會受到二次復雜度,以及長度外推能力弱的限制。
        盡管已有次二次方解決方案(諸如線性注意力,狀態空間模型),但它們在預訓練效率,甚至下游任務的準確率上,通常還不及Transformer。
        Megalodon的出現,就是為了解決無限處理上下文的難題。
        同時,它可以同時實現高效訓練(減少通信和計算量),以及高效推理(保持恒定的KV緩存)。
        值得一提的是


        原文鏈接:新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2

        聯系作者

        文章來源:新智元
        作者微信:AI_era
        作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲成熟xxxxx电影| 亚洲午夜久久久久久久久电影网| 亚洲国产成人私人影院| a级毛片免费在线观看| 亚洲日本一区二区三区在线| 三年在线观看免费观看完整版中文| 亚洲Aⅴ无码一区二区二三区软件| 国产精品亚洲一区二区三区在线观看 | 免费一级毛片在线播放视频| 国产亚洲成人久久| a级成人毛片免费视频高清| 国产亚洲av片在线观看16女人| a毛片久久免费观看| 亚洲成年轻人电影网站www| 99爱在线精品免费观看| 亚洲色偷偷综合亚洲av78 | 欧美在线看片A免费观看| 亚洲色大成网站www| 亚洲成年看片在线观看| 天黑黑影院在线观看视频高清免费| 久久亚洲中文字幕精品有坂深雪| 免费看黄视频网站| 疯狂做受xxxx高潮视频免费| 亚洲乱码国产乱码精品精| 最近最新高清免费中文字幕| 亚洲日韩国产精品乱-久| 亚洲国产天堂久久综合| 免费一级毛片在线播放视频| 亚洲Av高清一区二区三区| 国产精品免费看香蕉| 久草免费手机视频| 亚洲欧美日韩一区二区三区| 久久亚洲中文字幕精品一区| 84pao强力永久免费高清| 国产成人精品日本亚洲语音| 亚洲国产精品一区二区成人片国内| 精品无码无人网站免费视频| 国产亚洲精品美女| 亚洲好看的理论片电影| 日本不卡视频免费| 99在线视频免费|