<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Mamba可以替代Transformer,但它們也能組合起來使用

        AIGC動態2年前 (2024)發布 機器之心
        616 0 0

        Mamba可以替代Transformer,但它們也能組合起來使用

        AIGC動態歡迎閱讀

        原標題:Mamba可以替代Transformer,但它們也能組合起來使用
        關鍵字:序列,報告,上下文,狀態,注意力
        文章來源:機器之心
        內容字數:8264字

        內容摘要:


        機器之心報道
        編輯:Panda W1+1>2。Transformer 很厲害,但并不完美,尤其是在處理長序列方面。而狀態空間模型(SSM)則在長序列上的表現相當不俗。早在去年就有研究者提出可使用 SSM 替代 Transformer,參見文章《預訓練無需注意力,擴展到4096個token不成問題,與BERT相當》,前些天基于 SSM 方法的 Mamba 更是異軍突起,推理吞吐量達到了 Transformer 的五倍之多,參閱《五倍吞吐量,性能全面包圍Transformer:新架構Mamba引爆AI圈》。
        但實際上,SSM 和 Transformer 并不是非此即彼的兩種架構,它們完全可以組合起來!
        近日公布的一篇 NeurIPS 2023 論文《Block-State Transformers》就采用了這種做法,其不僅能輕松支持 65k token 長度的超長輸入,而且計算效率還非常高,速度相比使用循環單元的 Transformer 足可提升十倍之多!這篇論文也得到了 Mamba 作者 Tri Dao 的點贊,他表示:「SSM 和Transformer 似乎可以互補。」但在我們介紹這種


        原文鏈接:Mamba可以替代Transformer,但它們也能組合起來使用

        聯系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 最近的中文字幕大全免费8| 中国一级特黄的片子免费| 亚洲美女大bbbbbbbbb| 91大神亚洲影视在线| 久久国产精品2020免费m3u8| 亚洲啪啪免费视频| 国产成人免费a在线资源| 亚洲爆乳无码专区| 国产亚洲综合久久| 永久在线免费观看| 国产亚洲人成A在线V网站| 国产色在线|亚洲| a级特黄毛片免费观看| 免费无码黄网站在线观看| 亚洲AV无码日韩AV无码导航| 青青青亚洲精品国产| 亚洲黄色免费观看| 最新亚洲精品国偷自产在线| 久久久免费的精品| 在线观看亚洲天天一三视| 综合一区自拍亚洲综合图区| 亚洲AV伊人久久青青草原| 精品国产日韩久久亚洲| 国产成人综合久久精品免费| 免费大片av手机看片高清| 无码人妻一区二区三区免费| 亚洲av无码不卡| 野花高清在线观看免费3中文| 亚洲av无一区二区三区| 在线a级毛片免费视频| 国产亚洲精品AAAA片APP| 亚洲桃色AV无码| www免费插插视频| 免费a级毛片在线观看| 亚洲av成人片在线观看| 色噜噜AV亚洲色一区二区| 最近免费视频中文字幕大全| 亚洲AV无码成人精品区日韩| 亚洲精品无码精品mV在线观看| 成年大片免费视频播放一级| 亚洲国产成人精品女人久久久|