<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        北大發現了一種特殊類型的注意力頭!

        AIGC動態1年前 (2024)發布 夕小瑤科技說
        389 0 0

        北大發現了一種特殊類型的注意力頭!

        AIGC動態歡迎閱讀

        原標題:北大發現了一種特殊類型的注意力頭!
        關鍵字:模型,屏蔽,研究人員,幻覺,上下文
        文章來源:夕小瑤科技說
        內容字數:5520字

        內容摘要:


        夕小瑤科技說 原創作者 | 任同學檢索頭的發現或許將有力地幫助大模型領域在提高長上下文推理能力、減少幻覺和壓縮KV緩存方面的研究。
        從 Claude100K 到 Gemini10M,我們正處于長上下文語言模型的時代。如何在長上下文中利用任何輸入位置的信息?北大聯合另外四所高校發現了一種特殊類型的、負責從長上下文中進行檢索的注意力頭。
        研究人員對4個模型族、6個模型尺度和3種微調類型的系統調查表明,存在一種特殊類型的注意力頭(稱之為檢索頭),它主要負責從長上下文中檢索相關信息。
        研究人員發現了檢索頭具有一些重要和有趣的性質:
        通用性:所有具有長上下文能力的探索模型都有一組檢索頭;
        稀疏性:只有一小部分(小于5%)的注意頭是檢索頭;
        內在性:檢索頭在短上下文預訓練的模型中已經存在。當將上下文長度擴展到32-128K時,仍然是同一組注意力頭執行信息檢索;
        動態激活:以 Llama-27B 為例,無論上下文如何變化,12個檢索頭始終關注所需信息。其余的檢索頭在不同的環境中被激活;
        因果關系:完全修剪檢索頭導致檢索相關信息失敗,產生幻覺,而修剪隨機的非檢索頭不影響模型的檢索能力。
        由于檢索頭用于


        原文鏈接:北大發現了一種特殊類型的注意力頭!

        聯系作者

        文章來源:夕小瑤科技說
        作者微信:xixiaoyaoQAQ
        作者簡介:專業、有趣、深度價值導向的科技媒體。聚集30萬AI工程師、研究員,覆蓋500多家海內外機構投資人,互聯網大廠中高管和AI公司創始人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備敏銳的行業嗅覺和洞察深度。商務合作:zym5189

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 精品无码一级毛片免费视频观看 | 免费无码又爽又刺激网站| 特级毛片A级毛片100免费播放| 亚洲欧美日韩久久精品| www视频在线观看免费| 四虎免费在线观看| 国产一区二区三区免费视频| 亚洲av最新在线观看网址| 精品国产污污免费网站入口| 亚洲精品视频免费观看| 又长又大又粗又硬3p免费视频| 日韩在线免费视频| 最新亚洲精品国偷自产在线| 久久免费公开视频| 亚洲老熟女@TubeumTV| 中文字幕无码不卡免费视频 | 亚洲最大的成网4438| 亚洲sm另类一区二区三区| 国产成人无码免费视频97 | 欧洲一级毛片免费| 亚洲人成电影网站免费| 免费国产一级特黄久久| 亚洲av午夜福利精品一区| 亚洲精品理论电影在线观看| 亚洲国产激情一区二区三区| 中国国产高清免费av片| 亚洲毛片一级带毛片基地| 国产精品无码永久免费888| 亚洲av永久无码精品古装片 | 日本午夜免费福利视频| 亚洲偷自精品三十六区| 国产美女无遮挡免费网站| a视频在线免费观看| 亚洲午夜久久久久久尤物| 国产禁女女网站免费看| 国产自国产自愉自愉免费24区 | 中文字幕亚洲第一在线| 日韩免费视频播播| 久久国产精品免费观看| 亚洲色大成网站www永久男同| 日本亚洲国产一区二区三区|