<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Mamba架構第一次做大!混合Transformer,打敗Transformer

        AIGC動態1年前 (2024)發布 量子位
        423 0 0

        Mamba架構第一次做大!混合Transformer,打敗Transformer

        AIGC動態歡迎閱讀

        原標題:Mamba架構第一次做大!混合Transformer,打敗Transformer
        關鍵字:騰訊,吞吐量,模型,高效,上下文
        文章來源:量子位
        內容字數:3955字

        內容摘要:


        豐色 發自 凹非寺量子位 | 公眾號 QbitAI精彩精彩,第一個把爆火Mamba架構真正擴展到足夠大的工作來了。
        520億參數,還是Mamba+Transformer混合架構。
        它的名字叫Jamba。
        取兩種架構之長,模型質量和效率兼得,要吞吐量有吞吐量,要低內存有低內存。
        初步跑分顯示:
        Jamba性能總體接近Mixtral 8x-7B,處理128k長上下文時吞吐量卻是其3倍。
        一共支持256k上下文,而單張A100 GPU即可處理140k,直接拿下同等規模模型之最,高效又經濟。
        這項成果,來自AI公司AI21labs。
        Mamba原作者看了之后都激動轉發:
        絕對的“大新聞”。
        Mamba、Transformer,合體由CMU和普林斯頓大學提出的Mamba,解決了Transformer的局限性(隨著推理上下文越長,模型內存占用量越大,同時推理速度變慢,由此導致算力消耗巨大)。
        但它也有自己的缺點——
        在不關注整個上下文的情況下,Mamba的輸出質量很差,尤其是在召回相關的任務上。
        本著“既要也要”的原則,Jamba站出來提供兩全其美之作。
        Jamba由Transformer、


        原文鏈接:Mamba架構第一次做大!混合Transformer,打敗Transformer

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲精品动漫免费二区| 特级毛片A级毛片免费播放| 久草免费手机视频| 91麻豆国产自产在线观看亚洲| 怡红院亚洲红怡院在线观看| 国产一级一片免费播放i| 亚洲欧美日韩综合久久久| 成人免费视频网址| 亚洲日韩一中文字暮| 国产免费观看视频| 人禽伦免费交视频播放| 亚洲色精品88色婷婷七月丁香 | 国产亚洲色视频在线| 一级特黄录像免费播放肥| 亚洲精品少妇30p| 亚洲日本VA午夜在线电影| 大香人蕉免费视频75| 视频一区二区三区免费观看| 亚洲国产一区二区视频网站| 中国一级特黄的片子免费| 亚洲美女大bbbbbbbbb| 免费无码AV片在线观看软件| 久久无码av亚洲精品色午夜 | 亚洲成a人片在线观看中文app| 国产在线观看麻豆91精品免费| 亚洲kkk4444在线观看| 免费va人成视频网站全| 久久精品国产免费一区| 亚洲一区二区三区高清视频| 国产一区二区三区在线免费观看| 国产黄在线播放免费观看| 亚洲精品福利在线观看| 国产日产成人免费视频在线观看| 91免费在线视频| 亚洲AV无码精品蜜桃| 国产gav成人免费播放视频| 可以免费观看的国产视频| 自拍偷区亚洲国内自拍| 亚洲一区二区三区在线观看精品中文| 100部毛片免费全部播放完整| 亚洲日韩国产一区二区三区在线|