<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Mamba架構第一次做大!混合Transformer,打敗Transformer

        AIGC動態1年前 (2024)發布 量子位
        421 0 0

        Mamba架構第一次做大!混合Transformer,打敗Transformer

        AIGC動態歡迎閱讀

        原標題:Mamba架構第一次做大!混合Transformer,打敗Transformer
        關鍵字:騰訊,吞吐量,模型,高效,上下文
        文章來源:量子位
        內容字數:3955字

        內容摘要:


        豐色 發自 凹非寺量子位 | 公眾號 QbitAI精彩精彩,第一個把爆火Mamba架構真正擴展到足夠大的工作來了。
        520億參數,還是Mamba+Transformer混合架構。
        它的名字叫Jamba。
        取兩種架構之長,模型質量和效率兼得,要吞吐量有吞吐量,要低內存有低內存。
        初步跑分顯示:
        Jamba性能總體接近Mixtral 8x-7B,處理128k長上下文時吞吐量卻是其3倍。
        一共支持256k上下文,而單張A100 GPU即可處理140k,直接拿下同等規模模型之最,高效又經濟。
        這項成果,來自AI公司AI21labs。
        Mamba原作者看了之后都激動轉發:
        絕對的“大新聞”。
        Mamba、Transformer,合體由CMU和普林斯頓大學提出的Mamba,解決了Transformer的局限性(隨著推理上下文越長,模型內存占用量越大,同時推理速度變慢,由此導致算力消耗巨大)。
        但它也有自己的缺點——
        在不關注整個上下文的情況下,Mamba的輸出質量很差,尤其是在召回相關的任務上。
        本著“既要也要”的原則,Jamba站出來提供兩全其美之作。
        Jamba由Transformer、


        原文鏈接:Mamba架構第一次做大!混合Transformer,打敗Transformer

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲另类小说图片| 亚洲日韩激情无码一区| 亚洲噜噜噜噜噜影院在线播放| 99麻豆久久久国产精品免费| 亚洲精品人成无码中文毛片| 国产亚洲Av综合人人澡精品| 免费在线不卡视频| 免费国产草莓视频在线观看黄| 国产免费直播在线观看视频| 黄色免费网站在线看| 亚洲情侣偷拍精品| 岛国精品一区免费视频在线观看| 国产亚洲精品精品国产亚洲综合| 国产免费内射又粗又爽密桃视频| 亚洲精品自产拍在线观看| 国内精品一级毛片免费看| 亚洲综合无码一区二区| 人妻视频一区二区三区免费| 亚洲国产美女精品久久久| 波多野结衣一区二区免费视频| 午夜成人无码福利免费视频| 亚洲国产综合无码一区| 96免费精品视频在线观看| 亚洲伊人色一综合网| 国产成人免费高清在线观看| 一级午夜a毛片免费视频| 亚洲国产精品嫩草影院在线观看| 99久久免费精品视频| 亚洲精品无码不卡在线播放| 亚洲熟妇AV一区二区三区宅男| 大学生美女毛片免费视频| 免费无码午夜福利片69| 亚洲成在人线av| 国内精品免费视频自在线| 国产精品青草视频免费播放| 亚洲精品美女久久久久| 国产乱子伦精品免费女| 免费黄色电影在线观看| 亚洲日本VA午夜在线电影| 好看的电影网站亚洲一区| 成人毛片视频免费网站观看|