<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        ICML2024高分!魔改注意力,讓小模型能打兩倍大的模型

        AIGC動(dòng)態(tài)1年前 (2024)發(fā)布 量子位
        472 0 0

        ICML2024高分!魔改注意力,讓小模型能打兩倍大的模型

        AIGC動(dòng)態(tài)歡迎閱讀

        原標(biāo)題:ICML2024高分!魔改注意力,讓小模型能打兩倍大的模型
        關(guān)鍵字:注意力,模型,矩陣,動(dòng)態(tài),回路
        文章來源:量子位
        內(nèi)容字?jǐn)?shù):0字

        內(nèi)容摘要:


        彩云科技團(tuán)隊(duì) 投稿量子位 | 公眾號 QbitAI改進(jìn)Transformer核心機(jī)制注意力,讓小模型能打兩倍大的模型!
        ICML 2024高分論文,彩云科技團(tuán)隊(duì)構(gòu)建DCFormer框架,替換Transformer核心組件多頭注意力模塊(MHA),提出可動(dòng)態(tài)組合的多頭注意力(DCMHA)。
        DCMHA解除了MHA注意力頭的查找選擇回路和變換回路的固定綁定,讓它們可以根據(jù)輸入動(dòng)態(tài)組合,從根本上提升了模型的表達(dá)能力。
        可以近似理解為,原來每層有固定的H個(gè)注意力頭,現(xiàn)在用幾乎同樣的參數(shù)量和算力,可按需動(dòng)態(tài)組合出多至HxH個(gè)注意力頭。
        DCMHA即插即用,可在任何Transformer架構(gòu)中替換MHA,得到通用、高效和可擴(kuò)展的新架構(gòu)DCFormer。
        這項(xiàng)工作由來自北京郵電大學(xué)、AI創(chuàng)業(yè)公司彩云科技的研究人員共同完成。
        研究人員用在DCFormer基礎(chǔ)上打造的模型DCPythia-6.9B,在預(yù)訓(xùn)練困惑度和下游任務(wù)評估上都優(yōu)于開源Pythia-12B。
        DCFormer模型在性能上與那些計(jì)算量是其1.7-2倍的Transformer模型相當(dāng)。
        多頭注意力模塊有何局限?大模型的scaling la


        原文鏈接:ICML2024高分!魔改注意力,讓小模型能打兩倍大的模型

        聯(lián)系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲AV无码成人精品区狼人影院| 日韩伦理片电影在线免费观看| 亚洲偷自拍拍综合网| 日韩亚洲国产综合高清| 桃子视频在线观看高清免费完整| 亚洲精品视频专区| 91香蕉国产线观看免费全集| 亚洲伦另类中文字幕| 97在线视频免费播放| 亚洲国产日韩在线成人蜜芽| 国产一卡二卡四卡免费| 国产成人亚洲精品| 日本特黄特色aa大片免费| 亚洲av无一区二区三区| 四虎国产精品免费久久影院| 午夜在线免费视频 | 在线看片韩国免费人成视频| 亚洲码一区二区三区| 三年片在线观看免费大全 | 香蕉视频在线观看免费| 久久亚洲精品无码观看不卡| 久久久国产精品福利免费| 久久精品国产亚洲AV麻豆王友容 | 中文字幕久精品免费视频| 久久av无码专区亚洲av桃花岛| 四虎永久在线精品免费观看视频| 亚洲欧美日韩综合久久久| 免费少妇a级毛片| 十八禁无码免费网站| 亚洲精品无码少妇30P| 久久久久亚洲AV无码专区桃色| 东北美女野外bbwbbw免费| 亚洲人成片在线观看| 成人国产mv免费视频| 中文字幕在线免费看线人| 亚洲国产精品综合久久久| 五月婷婷亚洲综合| 久久免费观看国产99精品| 亚洲色成人WWW永久在线观看| 国产亚洲AV手机在线观看| 国产香蕉免费精品视频|