<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        DeepMind攜Mamba華人作者推Transformer之作!性能暴漲媲美Llama 2,推理能效大幅碾壓

        AIGC動態2年前 (2024)發布 新智元
        308 0 0

        DeepMind攜Mamba華人作者推Transformer革命之作!性能暴漲媲美Llama 2,推理能效大幅碾壓

        AIGC動態歡迎閱讀

        原標題:DeepMind攜Mamba華人作者推Transformer之作!性能暴漲媲美Llama 2,推理能效大幅碾壓
        關鍵字:模型,線性,門控,序列,大小
        文章來源:新智元
        內容字數:10158字

        內容摘要:


        新智元報道編輯:編輯部
        【新智元導讀】線性RNN贏了?近日,谷歌DeepMind一口氣推出兩大新架構,在d基準測試中超越了Transformer。新架構不僅保證了高效的訓練和推理速度,并且成功擴展到了14B。Transformer又又又被挑戰了!
        這次的挑戰者來自大名鼎鼎的谷歌DeepMind,并且一口氣推出了兩種新架構,——Hawk和Griffin。
        論文地址:https://arxiv.org/abs/2402.19427
        這種將門控線性RNN與局部注意力混合在一起的模型新架構的表現相當亮眼。
        首先,同為線性RNN架構的Griffin,憑借著1/2的訓練數據,在所有評測中全面優于之前大火的Mamba。
        更重要的是,Griffin將模型成功擴展到了14B,做到了Mamba想做卻沒能做的事。
        其次,面對基于Transformer架構的模型,Griffin則憑借著1/6的訓練數據,打平甚至超越了同等參數量的Llama 2!
        同時,模型能夠利用很長的上下文來改進其預測,表明線性RNN的外推能力可以遠遠超出它們訓練的序列長度。
        此外,團隊還證明了這種組合構架保留了Transformer在合


        原文鏈接:DeepMind攜Mamba華人作者推Transformer之作!性能暴漲媲美Llama 2,推理能效大幅碾壓

        聯系作者

        文章來源:新智元
        作者微信:AI_era
        作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 日韩亚洲欧洲在线com91tv| 亚洲国产成人VA在线观看| 久久久青草青青国产亚洲免观 | www在线观看播放免费视频日本| 99久久免费看国产精品| 亚洲精品国产日韩无码AV永久免费网 | 久久久久久AV无码免费网站下载 | 国产精品成人免费观看| 国产免费AV片无码永久免费| 国产亚洲中文日本不卡二区| 222www免费视频| 内射干少妇亚洲69XXX| 精品成人免费自拍视频| 亚洲熟女少妇一区二区| 四虎国产精品成人免费久久| 免费亚洲视频在线观看| 极品色天使在线婷婷天堂亚洲| 成人免费视频网址| 亚洲色大成网站www久久九| 四虎永久在线精品免费网址| 亚洲人成免费网站| 野花高清在线电影观看免费视频| 亚洲电影免费观看| 在线精品一卡乱码免费| 亚洲一级黄色大片| 成人影片麻豆国产影片免费观看| 亚洲另类自拍丝袜第1页| 国产免费的野战视频| 国产成人精品亚洲2020| 成人免费视频观看无遮挡| 激情无码亚洲一区二区三区| 国产精品免费电影| 九九全国免费视频| 亚洲高清国产拍精品26U| 无人在线观看免费高清| 亚洲精品在线电影| 四虎影视大全免费入口| 思思久久99热免费精品6| 亚洲AV无码专区亚洲AV伊甸园| 99ee6热久久免费精品6| 亚洲中文字幕无码av|