<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        稀疏注意力再添一員,華為諾亞推出高效選擇注意力架構ESA

        AIGC動態7個月前發布 智猩猩GenAI
        406 0 0

        為大模型在長序列任務中的應用帶來了新的可能性。

        稀疏注意力再添一員,華為諾亞推出高效選擇注意力架構ESA

        原標題:稀疏注意力再添一員,華為諾亞推出高效選擇注意力架構ESA
        文章來源:智猩猩GenAI
        內容字數:6412字

        華為諾亞方舟實驗室提出高效選擇性注意力算法ESA

        本文介紹了華為諾亞方舟實驗室提出的高效選擇性注意力算法ESA (Efficient Selective Attention),該算法旨在解決大語言模型(LLMs)處理長文本序列時的效率瓶頸。ESA通過創新性的稀疏注意力機制,在顯著降低計算復雜度的同時,保持了模型的準確性,實現了上下文長度的有效擴展。

        1. 長序列處理的挑戰

        隨著序列長度的增加,注意力計算的復雜度呈平方級增長,這使得高效且準確的長序列推理成為一大挑戰?,F有方法試圖通過短序列訓練成果外推到長序列,但面臨著OOD(out-of-distribution)問題和計算量迅速增大的難題。選擇性注意力(Selective Attention)利用注意力矩陣的稀疏性,選擇部分token進行計算,但token粒度選擇會引入巨大的計算開銷。

        2. ESA算法的核心思想

        ESA算法的核心在于平衡選擇性注意力方法中的靈活性與效率。它通過以下兩個核心步驟實現高效的長序列處理:

        1. 高效選擇:ESA采用基于query感知的token粒度選擇機制。通過對query和key進行低維壓縮(約3.2%),計算token的重要性分數,并考慮周圍token的影響(鄰距影響力),避免僅選擇top-ranked token導致的性能下降。
        2. 注意力計算:在選擇關鍵token后,ESA使用被選中token的完整query和key進行注意力計算,而非對所有前序token進行計算,從而大幅降低復雜度。

        ESA的具體實現包括將輸入序列的token分為四部分:全局注意力和局部注意力。初始token和ESA選擇的topk中間token拼接起來計算全局注意力,局部token用于計算窗口注意力,兩部分注意力融合計算最終的注意力。ESA采用chunked-prefill緩存key和value,動態選擇關鍵token。

        3. ESA算法的創新點

        ESA的主要創新在于其基于token的細粒度選擇性注意力機制。它能夠在prefilling和decoding階段動態選擇最關鍵的少量token,而不是固定block選擇或永久丟棄不重要的token。通過低維壓縮query和key,將注意力計算復雜度從平方級降低到線性級。此外,ESA引入了鄰距影響力,考慮周圍token的影響,進一步提升了模型性能。

        4. 實驗結果與分析

        論文在Longbench、InfiniteBench、NeedleBench等公開的長序列基準測試中驗證了ESA的性能。結果表明,ESA在高倍外推場景下優于全注意力算法,尤其在multi needles檢索場景下表現突出。實驗還分析了鄰距影響力超參數的影響,以及將所有head整合計算重要性分數對算法的影響。

        5. 總結與展望

        ESA有效平衡了長序列外推場景下的選擇性注意力中的靈活性和計算效率,無需模型參數增量微調即可擴展上下文長度。ESA通過選擇固定數量的最重要token計算注意力,并利用注意力矩陣的稀疏性,在輸入序列足夠長時,通過低維壓縮query和key有效降低計算復雜度。未來的研究方向包括探索更準確高效的選擇重要token的方法,以及軟硬件協同的高效外推方案。


        聯系作者

        文章來源:智猩猩GenAI
        作者微信:
        作者簡介:智猩猩旗下賬號,專注于生成式人工智能,主要分享技術文章、論文成果與產品信息。

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产精品免费观看久久| 日本免费一区二区三区| 破了亲妺妺的处免费视频国产| a级片免费在线观看| 亚洲国产精品日韩| 人与动性xxxxx免费| 亚洲一本大道无码av天堂| 亚洲一区二区在线视频| 久久ww精品w免费人成| 久久久久久久亚洲Av无码| 中文字幕成人免费视频| 亚洲激情黄色小说| 最新仑乱免费视频| 国产精品亚洲综合天堂夜夜| 91精品啪在线观看国产线免费| 亚洲精品美女久久久久9999| 免费观看激色视频网站bd| 亚洲人成77777在线播放网站不卡| 美女黄网站人色视频免费国产 | 国产伦精品一区二区免费| 自拍偷自拍亚洲精品情侣| 亚洲精品免费视频| 国产乱辈通伦影片在线播放亚洲 | 99热在线观看免费| 亚洲一区无码中文字幕乱码| 成人五级毛片免费播放| 亚洲视频网站在线观看| 国产精品成人免费视频网站京东| 日本亚洲高清乱码中文在线观看| 国产成人毛片亚洲精品| 三年片在线观看免费观看大全动漫| 91亚洲国产成人久久精品| 国产做床爱无遮挡免费视频| 91在线视频免费观看| 亚洲成a人不卡在线观看| 美女视频黄的免费视频网页| 亚洲毛片一级带毛片基地| 国产成人啪精品视频免费网| 毛片在线全部免费观看| 亚洲欧美国产欧美色欲| 日韩亚洲人成在线综合日本|