<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        DeepMind攜Mamba華人作者推Transformer之作!性能暴漲媲美Llama 2,推理能效大幅碾壓

        AIGC動態1年前 (2024)發布 新智元
        308 0 0

        DeepMind攜Mamba華人作者推Transformer革命之作!性能暴漲媲美Llama 2,推理能效大幅碾壓

        AIGC動態歡迎閱讀

        原標題:DeepMind攜Mamba華人作者推Transformer之作!性能暴漲媲美Llama 2,推理能效大幅碾壓
        關鍵字:模型,線性,門控,序列,大小
        文章來源:新智元
        內容字數:10158字

        內容摘要:


        新智元報道編輯:編輯部
        【新智元導讀】線性RNN贏了?近日,谷歌DeepMind一口氣推出兩大新架構,在d基準測試中超越了Transformer。新架構不僅保證了高效的訓練和推理速度,并且成功擴展到了14B。Transformer又又又被挑戰了!
        這次的挑戰者來自大名鼎鼎的谷歌DeepMind,并且一口氣推出了兩種新架構,——Hawk和Griffin。
        論文地址:https://arxiv.org/abs/2402.19427
        這種將門控線性RNN與局部注意力混合在一起的模型新架構的表現相當亮眼。
        首先,同為線性RNN架構的Griffin,憑借著1/2的訓練數據,在所有評測中全面優于之前大火的Mamba。
        更重要的是,Griffin將模型成功擴展到了14B,做到了Mamba想做卻沒能做的事。
        其次,面對基于Transformer架構的模型,Griffin則憑借著1/6的訓練數據,打平甚至超越了同等參數量的Llama 2!
        同時,模型能夠利用很長的上下文來改進其預測,表明線性RNN的外推能力可以遠遠超出它們訓練的序列長度。
        此外,團隊還證明了這種組合構架保留了Transformer在合


        原文鏈接:DeepMind攜Mamba華人作者推Transformer之作!性能暴漲媲美Llama 2,推理能效大幅碾壓

        聯系作者

        文章來源:新智元
        作者微信:AI_era
        作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲另类无码专区丝袜| 18禁在线无遮挡免费观看网站| 亚洲色大18成人网站WWW在线播放 亚洲色大成WWW亚洲女子 | 成人免费一区二区三区在线观看| 1000部夫妻午夜免费| 国产精彩免费视频| 一本久久综合亚洲鲁鲁五月天| 亚洲高清无码在线观看| 国产亚洲人成网站在线观看不卡| 亚洲不卡av不卡一区二区| 亚洲高清一区二区三区| 一个人晚上在线观看的免费视频| 51在线视频免费观看视频| 永久免费看bbb| 亚洲黄色在线网站| 国产精品亚洲а∨无码播放不卡 | 一级A毛片免费观看久久精品 | 精品亚洲成A人在线观看青青| 亚洲免费观看视频| 又粗又硬免费毛片| 亚洲一区在线观看视频| 久久久久免费精品国产| 青青青国产色视频在线观看国产亚洲欧洲国产综合 | 四虎在线免费播放| 亚洲国产精品人久久电影| 人人爽人人爽人人片av免费| 久久精品女人天堂AV免费观看| 亚洲日产韩国一二三四区| 免费看一级一级人妻片| 美女被免费喷白浆视频| 亚洲视频一区在线观看| 日韩精品无码免费专区网站| 国产亚洲精品免费视频播放| 国产精品亚洲一区二区在线观看| 国产99视频精品免费观看7| 亚洲成a人片在线网站| 精品香蕉在线观看免费| 亚洲精品日韩中文字幕久久久| 免费网站观看WWW在线观看| 国产亚洲精AA在线观看SEE| 久久毛片免费看一区二区三区|