<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        誰能撼動Transformer統治地位?Mamba作者談LLM未來架構

        AIGC動態2年前 (2023)發布 機器之心
        525 0 0

        誰能撼動Transformer統治地位?Mamba作者談LLM未來架構

        AIGC動態歡迎閱讀

        原標題:誰能撼動Transformer統治地位?Mamba作者談LLM未來架構
        關鍵字:模型,狀態,注意力,架構,機制
        文章來源:機器之心
        內容字數:16785字

        內容摘要:


        機器之心編譯
        機器之心編輯部自 2017 年被提出以來,Transformer 已成為 AI 大模型的主流架構,未來這種情況是一直持續,還是會有新的研究出現,我們不妨先聽聽身處 AI 圈的研究者是怎么想的。在大模型領域,一直穩站 C 位的 Transformer 最近似乎有被超越的趨勢。
        這個挑戰者就是一項名為「Mamba」的研究,其在語言、音頻和基因組學等多種模態中都達到了 SOTA 性能。在語言建模方面,無論是預訓練還是下游評估,Mamba-3B 模型都優于同等規模的 Transformer 模型,并能與兩倍于其規模的 Transformer 模型相媲美。論文一經發表,引起了不小的轟動。驚嘆之余,大家發現論文作者只有兩位,一位是卡內基梅隆大學機器學習系助理教授 Albert Gu,另一位是 Together.AI 首席科學家、普林斯頓大學計算機科學助理教授(即將上任)Tri Dao。
        這項研究的一個重要創新是引入了一個名為「選擇性 SSM( selective state space model)」的架構,相比于 Transformer 中的自注意力機制的計算量會隨著上下文長度的增


        原文鏈接:誰能撼動Transformer統治地位?Mamba作者談LLM未來架構

        聯系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲.国产.欧美一区二区三区| 麻豆精品国产免费观看| 久久久无码精品亚洲日韩软件| 亚洲日韩精品无码专区加勒比☆ | a在线视频免费观看在线视频三区 a毛片成人免费全部播放 | 国产成人精品日本亚洲语音| 亚洲精品国产精品国自产网站| 久久精品视频免费看| 一个人免费观看视频在线中文| 91福利免费视频| 国产又大又黑又粗免费视频| 国产一区二区三区亚洲综合| 亚洲成AⅤ人影院在线观看| 精品无码一级毛片免费视频观看| 18勿入网站免费永久| 亚洲综合久久精品无码色欲| 精品国产污污免费网站入口在线| 国产亚洲免费的视频看| 久久永久免费人妻精品下载| 亚洲女人影院想要爱| 免费无码看av的网站| 国产黄片不卡免费| 亚洲男人的天堂在线播放| 亚洲A∨精品一区二区三区下载| 免费在线精品视频| 成人电影在线免费观看| 亚洲春色另类小说| 暖暖免费高清日本一区二区三区| 一本久久A久久免费精品不卡| 亚洲av日韩av无码黑人| 成熟女人牲交片免费观看视频 | 国产精品亚洲综合一区在线观看| 亚洲一区二区三区乱码A| 亚洲国产成人久久精品大牛影视 | 和日本免费不卡在线v| 亚洲日产无码中文字幕| 国产亚洲女在线线精品| 亚洲精品成人无码中文毛片不卡| AV大片在线无码永久免费| 免费人妻精品一区二区三区| 亚洲综合自拍成人|