<label id="3dn8r"><mark id="3dn8r"></mark></label>

<span id="3dn8r"></span>

<span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

Mamba架構第一次做大！混合Transformer，打敗Transformer

AIGC動態1年前 (2024)發布量子位

421 0 0

Mamba架構第一次做大！混合Transformer，打敗Transformer

AIGC動態歡迎閱讀

原標題：Mamba架構第一次做大！混合Transformer，打敗Transformer
關鍵字：騰訊,吞吐量,模型,高效,上下文
文章來源：量子位
內容字數：3955字

內容摘要：

豐色發自凹非寺量子位 | 公眾號 QbitAI精彩精彩，第一個把爆火Mamba架構真正擴展到足夠大的工作來了。
520億參數，還是Mamba+Transformer混合架構。
它的名字叫Jamba。
取兩種架構之長，模型質量和效率兼得，要吞吐量有吞吐量，要低內存有低內存。
初步跑分顯示：
Jamba性能總體接近Mixtral 8x-7B，處理128k長上下文時吞吐量卻是其3倍。
一共支持256k上下文，而單張A100 GPU即可處理140k，直接拿下同等規模模型之最，高效又經濟。
這項成果，來自AI公司AI21labs。
Mamba原作者看了之后都激動轉發：
絕對的“大新聞”。
Mamba、Transformer，合體由CMU和普林斯頓大學提出的Mamba，解決了Transformer的局限性（隨著推理上下文越長，模型內存占用量越大，同時推理速度變慢，由此導致算力消耗巨大）。
但它也有自己的缺點——
在不關注整個上下文的情況下，Mamba的輸出質量很差，尤其是在召回相關的任務上。
本著“既要也要”的原則，Jamba站出來提供兩全其美之作。
Jamba由Transformer、

原文鏈接：Mamba架構第一次做大！混合Transformer，打敗Transformer

聯系作者

文章來源：量子位
作者微信：QbitAI
作者簡介：追蹤人工智能新趨勢，關注科技行業新突破

# AIGC動態 # 上下文 # 吞吐量 # 模型 # 騰訊 # 高效

? 版權聲明

文章版權歸作者所有，未經允許請勿轉載。

Trae官網

相關文章

Trae官網

暫無評論

暫無評論...

主站蜘蛛池模板：亚洲另类小说图片| 亚洲日韩激情无码一区| 亚洲噜噜噜噜噜影院在线播放| 99麻豆久久久国产精品免费| 亚洲精品人成无码中文毛片| 国产亚洲Av综合人人澡精品| 免费在线不卡视频| 免费国产草莓视频在线观看黄| 国产免费直播在线观看视频| 黄色免费网站在线看| 亚洲情侣偷拍精品| 岛国精品一区免费视频在线观看| 国产亚洲精品精品国产亚洲综合| 国产免费内射又粗又爽密桃视频| 亚洲精品自产拍在线观看| 国内精品一级毛片免费看| 亚洲综合无码一区二区| 人妻视频一区二区三区免费| 亚洲国产美女精品久久久| 波多野结衣一区二区免费视频| 午夜成人无码福利免费视频| 亚洲国产综合无码一区| 96免费精品视频在线观看| 亚洲伊人色一综合网| 国产成人免费高清在线观看| 一级午夜a毛片免费视频| 亚洲国产精品嫩草影院在线观看| 99久久免费精品视频| 亚洲精品无码不卡在线播放| 亚洲熟妇AV一区二区三区宅男| 大学生美女毛片免费视频| 免费无码午夜福利片69| 亚洲成在人线av| 国内精品免费视频自在线| 国产精品青草视频免费播放| 亚洲精品美女久久久久| 国产乱子伦精品免费女| 免费黄色电影在线观看| 亚洲日本VA午夜在线电影| 好看的电影网站亚洲一区| 成人毛片视频免费网站观看|