<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        拆分Transformer注意力,韓國(guó)團(tuán)隊(duì)讓大模型解碼提速20倍

        AIGC動(dòng)態(tài)11個(gè)月前發(fā)布 量子位
        307 0 0

        拆分Transformer注意力,韓國(guó)團(tuán)隊(duì)讓大模型解碼提速20倍

        AIGC動(dòng)態(tài)歡迎閱讀

        原標(biāo)題:拆分Transformer注意力,韓國(guó)團(tuán)隊(duì)讓大模型解碼提速20倍
        關(guān)鍵字:向量,注意力,吞吐量,全局,序列
        文章來(lái)源:量子位
        內(nèi)容字?jǐn)?shù):0字

        內(nèi)容摘要:


        克雷西 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI只要將注意力切塊,就能讓大模型解碼提速20倍。
        來(lái)自韓國(guó)科學(xué)技術(shù)研究院、LG和DeepMind的研究人員,提出了一種新的Transformer架構(gòu)。
        不僅獲得了更快的推理速度,內(nèi)存開(kāi)銷也大幅度下降。
        研究人員詳細(xì)分析了原始Transformer推理速度慢的原因——
        原始Transformer每生成一個(gè)Token就要訪問(wèn)一次全局KV緩存,消耗了大量資源。
        實(shí)際上,這種方法的GPU有效利用率不到1%,其余的99%都用在了內(nèi)存訪問(wèn)上。
        針對(duì)這一問(wèn)題,團(tuán)隊(duì)對(duì)Transformer的注意力機(jī)制進(jìn)行了切塊調(diào)整,提出了名為Block Transformer的新架構(gòu)。
        結(jié)果在沒(méi)有明顯質(zhì)量損失的情況下,推理吞吐量提升了10-20倍。
        有網(wǎng)友表示,自己之前也有過(guò)類似的思路,但結(jié)果模型的性能不足,現(xiàn)在這個(gè)方法看上去確實(shí)有效削減了KV緩存。
        “切開(kāi)”Transformer的注意力原始Transformer當(dāng)中,對(duì)全局KV的頻繁訪問(wèn),導(dǎo)致計(jì)算復(fù)雜度高、內(nèi)存占用大,但推理吞吐量卻很低。
        針對(duì)這一問(wèn)題,作者的核心思路是將原始Transformer的全局注意力分解,


        原文鏈接:拆分Transformer注意力,韓國(guó)團(tuán)隊(duì)讓大模型解碼提速20倍

        聯(lián)系作者

        文章來(lái)源:量子位
        作者微信:QbitAI
        作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無(wú)評(píng)論

        暫無(wú)評(píng)論...
        主站蜘蛛池模板: 亚洲国产一区在线观看| 日韩免费高清一级毛片在线| 亚洲一区二区无码偷拍| 色天使色婷婷在线影院亚洲| 看亚洲a级一级毛片| 日韩在线免费看网站| 久久精品国产亚洲AV| 亚洲А∨精品天堂在线| 精品亚洲成a人片在线观看| 亚洲一区二区三区免费在线观看| 51视频精品全部免费最新| 亚洲精品视频在线观看免费| 国产男女爽爽爽免费视频 | 18禁美女黄网站色大片免费观看| 亚洲一二成人精品区| 国产精品亚洲一区二区在线观看 | 亚洲国产午夜电影在线入口| 国产无人区码卡二卡三卡免费 | 日本免费一区二区三区| 亚洲国产综合自在线另类| 国产免费av片在线看| 免费国产va在线观看| 美女网站免费福利视频| 亚洲av成人无码网站…| 亚洲精品人成无码中文毛片| 人人揉揉香蕉大免费不卡| 亚洲人成免费电影| 亚洲?v无码国产在丝袜线观看| 亚洲精品在线播放视频| 日本人护士免费xxxx视频| g0g0人体全免费高清大胆视频| 亚洲美女精品视频| 久久国产色AV免费看| 亚洲五月综合缴情在线观看| 国产成人亚洲精品播放器下载 | 免费高清av一区二区三区| xxxxx做受大片在线观看免费| 国产成人免费a在线资源| 亚洲精品一卡2卡3卡四卡乱码| 久久久久国产成人精品亚洲午夜 | 亚洲午夜精品第一区二区8050|