<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        基礎架構競爭激烈,LSTM原作者提出指數門控xLSTM,性能直逼Transformer和Mamba

        AIGC動態12個月前發布 大數據文摘
        560 0 0

        基礎架構競爭激烈,LSTM原作者提出指數門控xLSTM,性能直逼Transformer和Mamba

        AIGC動態歡迎閱讀

        原標題:基礎架構競爭激烈,LSTM原作者提出指數門控xLSTM,性能直逼Transformer和Mamba
        關鍵字:門控,模型,作者,記憶,向量
        文章來源:大數據文摘
        內容字數:7512字

        內容摘要:


        大數據文摘授權轉載自將門創投
        作者:seven_
        經典長短時記憶網絡(LSTM)架構最早可以追溯到20世紀90年代,因其獨特的常量誤差傳遞(constant error carousel,CEC)和門控(gating)機制而在處理各種時序序列數據任務中展示出了卓越的性能,尤其是在早期的大型語言模型(LLM)中發揮了關鍵作用。然而,隨著Transformer架構的出現,其高度可并行化運行的自注意力機制使得模型可以拓展到更大規模的應用中,導致LSTM的地位逐漸被取代。
        近日,LSTM的原作者Sepp Hochreiter帶隊對LSTM框架進行了全新升級,重點針對LSTM缺乏并行處理能力以及在存儲容量和靈活性上的缺陷進行了改進,提出了一種稱為xLSTM的全新架構。xLSTM提出了兩種新的內存單元設計:一種是使用標量內存和標量更新的sLSTM,它引入了新的記憶混合技術;另一種是mLSTM,它使用矩陣內存并能完全并行計算,采用協方差更新規則。
        作者通過實驗證明,xLSTM與最先進的Transformer模型和狀態空間模型(SSM)相比,顯示出了優越的性能和良好的可擴展性。這表明,通過對傳統LST


        原文鏈接:基礎架構競爭激烈,LSTM原作者提出指數門控xLSTM,性能直逼Transformer和Mamba

        聯系作者

        文章來源:大數據文摘
        作者微信:BigDataDigest
        作者簡介:普及數據思維,傳播數據文化

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲AV无码专区亚洲AV桃| 亚洲精品理论电影在线观看| www成人免费视频| 亚洲精品专区在线观看| 黄网站在线播放视频免费观看| 7777久久亚洲中文字幕蜜桃 | 亚洲一区无码中文字幕乱码| 亚洲午夜久久久影院伊人 | 亚洲第一视频网站| 十八禁无码免费网站| 亚洲国产精品无码专区影院| 两个人日本WWW免费版| 亚洲av色福利天堂| 精品国产sm捆绑最大网免费站| 亚洲色一色噜一噜噜噜| 一级毛片免费在线观看网站| 亚洲人成伊人成综合网久久久| 亚洲精品av无码喷奶水糖心| 国产精品无码素人福利免费| 免费看美女午夜大片| 亚洲AV中文无码字幕色三| 91香蕉国产线在线观看免费| 免费大黄网站在线观| A级毛片成人网站免费看| 亚洲国产成人片在线观看无码| 免费看一级一级人妻片| 亚洲精品亚洲人成人网| 午夜视频在线免费观看| 亚洲日韩AV无码一区二区三区人| 99精品免费观看| 亚洲精品女同中文字幕| 亚洲精品你懂的在线观看| 国产成人精品免费视频网页大全| 亚洲日韩精品无码专区网址| 国产大片线上免费观看| 亚洲av日韩aⅴ无码色老头| 亚洲午夜久久久久久久久久 | 亚洲人成人77777在线播放| 亚洲AV网站在线观看| 免费一级不卡毛片| 亚洲JLZZJLZZ少妇|