国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

把注意力計(jì)算丟給CPU，大模型解碼吞吐量提高1.76~4.99倍

AIGC動(dòng)態(tài)9個(gè)月前發(fā)布量子位

478 0 0

基于局部敏感哈希采樣技術(shù)

把注意力計(jì)算丟給CPU，大模型解碼吞吐量提高1.76~4.99倍

原標(biāo)題：把注意力計(jì)算丟給CPU，大模型解碼吞吐量提高1.76~4.99倍
文章來源：量子位
內(nèi)容字?jǐn)?shù)：5268字

MagicPIG: 緩解大語言模型KV緩存壓力的創(chuàng)新方案

來自卡內(nèi)基梅隆大學(xué)、華盛頓大學(xué)和Meta AI的研究人員提出了一種名為MagicPIG的新方法，有效解決了大語言模型(LLM)推理過程中GPU內(nèi)存容量限制的問題，該問題主要由KV緩存的巨大內(nèi)存占用引起。

1. KV緩存瓶頸與現(xiàn)有方法的不足

1. 在長(zhǎng)上下文LLM推理中，KV緩存用于存儲(chǔ)中間注意力鍵和值，避免重復(fù)計(jì)算，但其內(nèi)存占用隨批量大小和序列長(zhǎng)度線性增長(zhǎng)，嚴(yán)重限制了GPU的批量處理能力。

2. 現(xiàn)有技術(shù)如TopK Attention、Quest、H2O和Loki等，試圖通過選擇注意力得分最高的子集來壓縮KV緩存，但這些方法存在精度損失的問題，尤其在需要高上下文利用率的復(fù)雜任務(wù)中，性能下降嚴(yán)重。

3. 研究人員觀察到注意力機(jī)制的三個(gè)關(guān)鍵特性，解釋了TopK方法的局限性：首個(gè)輸入token的隱藏狀態(tài)幾乎不隨輸入變化；鍵狀態(tài)的中心方向在不同輸入句子中保持穩(wěn)定；鍵狀態(tài)的中心與匯聚點(diǎn)token的鍵狀態(tài)幾乎相反。

2. MagicPIG的創(chuàng)新之處

1. **基于采樣而非搜索:** MagicPIG采用基于采樣的注意力估計(jì)方法，而非像TopK那樣搜索最高的鍵值對(duì)。這通過引入基礎(chǔ)分布信息，顯著提高了估計(jì)精度，并降低了估計(jì)誤差。

2. **局部敏感哈希(LSH)技術(shù):** MagicPIG利用LSH生成采樣概率，并結(jié)合重要性采樣技術(shù)，有效地從已知分布中抽取樣本，來估計(jì)未知分布的期望，從而降低估計(jì)方差。

3. **異構(gòu)計(jì)算:** MagicPIG將注意力計(jì)算和哈希表卸載到CPU上，充分利用CPU的內(nèi)存資源，降低了對(duì)GPU顯存的依賴。實(shí)驗(yàn)表明，這種方法等效地提升了CPU的內(nèi)存帶寬，在維持精度的情況下實(shí)現(xiàn)了高效的注意力計(jì)算。

3. 系統(tǒng)設(shè)計(jì)與實(shí)驗(yàn)結(jié)果

1. MagicPIG將LLM解碼分為四個(gè)部分：參數(shù)計(jì)算(GPU)、注意力計(jì)算(CPU)、隨機(jī)投影(GPU)和檢索(CPU)。這種任務(wù)分區(qū)有效地利用了CPU和GPU的優(yōu)勢(shì)。

2. 實(shí)驗(yàn)結(jié)果表明，MagicPIG在Llama-3.1-8B-Instruct模型上，相比于Quest，在檢索和推理任務(wù)中實(shí)現(xiàn)了更高的下游準(zhǔn)確率。同時(shí)，MagicPIG的解碼吞吐量提高了1.76~4.99倍。

4. 總結(jié)

MagicPIG通過巧妙地結(jié)合LSH采樣技術(shù)和異構(gòu)計(jì)算，有效緩解了LLM推理過程中的KV緩存壓力，在保證精度的同時(shí)大幅提升了推理速度和吞吐量。這項(xiàng)研究為降低LLM部署成本，探索異構(gòu)計(jì)算的可能性提供了新的思路。

聯(lián)系作者

文章來源：量子位
作者微信：
作者簡(jiǎn)介：追蹤人工智能新趨勢(shì)，關(guān)注科技行業(yè)新突破

# AIGC動(dòng)態(tài)# AI模型CPU優(yōu)化 # CPU加速AI推理 # CPU大模型解碼 # 低功耗AI推理 # 大模型吞吐量提升

? 版權(quán)聲明

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載。

蟬鏡AI數(shù)字人

相關(guān)文章

蟬鏡AI數(shù)字人

暫無評(píng)論

暫無評(píng)論...

打開我，進(jìn)入AI時(shí)代。
全面、高效的AI工具產(chǎn)品情報(bào)，發(fā)現(xiàn)和使用最酷的AI工具！
Ctrl + D 或 ? + D 收藏本站到瀏覽器書簽欄。

OpenI AI助手在線工具硅基流動(dòng)豆包 Trae 扣子Coze 即夢(mèng)繪蛙

Copyright ? 2025 OpenI 粵ICP備19001258號(hào)

粵公網(wǎng)安備 44011502001135號(hào) SiteMap XML

国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

<label id="3dn8r"><mark id="3dn8r"></mark></label>

<span id="3dn8r"></span>

<span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

日韩美女天天操| 免费在线观看精品| 一区二区在线观看av| 91精品国产一区二区三区 | 国产激情一区二区三区四区| 一区二区三区成人| 日本欧洲一区二区| 成人激情综合网站| 91成人免费在线视频| 欧美一三区三区四区免费在线看 | 青青草精品视频| 国产亚洲va综合人人澡精品| 日本一区二区三区久久久久久久久不| 中文在线一区二区| 五月天视频一区| 精品一区二区三区影院在线午夜| 国产精品2024| 精品粉嫩aⅴ一区二区三区四区| 综合色天天鬼久久鬼色| 另类小说视频一区二区| 欧美性色黄大片| 久久免费电影网| 久久99精品一区二区三区三区| 久久综合久色欧美综合狠狠| 舔着乳尖日韩一区| 日韩欧美国产系列| 色噜噜狠狠成人中文综合| 狂野欧美性猛交blacked| 自拍偷拍亚洲欧美日韩| 日韩欧美亚洲国产另类| 91社区在线播放| 最新欧美精品一区二区三区| 国产精品一二三| 亚洲一区二区三区免费视频| 波波电影院一区二区三区| 中文字幕精品三区| 欧美一区二区网站| 欧美三级日韩在线| 久久激情五月婷婷| 日韩成人午夜精品| 亚洲影院在线观看| 香蕉久久夜色精品国产使用方法 | 蜜桃视频免费观看一区| 精品黑人一区二区三区久久 | 国产婷婷一区二区| 久久久久久久综合色一本| 26uuu精品一区二区三区四区在线 26uuu精品一区二区在线观看 | 91福利国产精品| 欧美日韩一级片在线观看| 色激情天天射综合网| 欧美美女bb生活片| 风间由美一区二区av101| 日韩在线一区二区| 欧美国产精品一区| 亚洲一区在线观看视频| 亚洲午夜电影在线| 亚洲午夜精品17c| 久久电影国产免费久久电影| 国产麻豆午夜三级精品| 日韩成人av影视| 成人在线综合网| 成人性生交大片免费看在线播放| 国产精品一区专区| 欧美伊人精品成人久久综合97 | 在线成人av影院| 亚洲免费伊人电影| 亚洲黄色录像片| 国产一区二区三区四区在线观看| www.日韩精品| 国产日韩高清在线| 久久99精品久久只有精品| 99精品欧美一区二区三区小说| 99精品偷自拍| 中文字幕欧美激情| 国产精品1区2区3区| 日韩一卡二卡三卡四卡| 久久精品亚洲一区二区三区浴池| 一区二区三区四区不卡视频 | 亚洲午夜一区二区| 99视频一区二区| 自拍偷拍亚洲激情| 欧美三级中文字| 日产欧产美韩系列久久99| 欧美一区二区三区视频在线| 日韩高清中文字幕一区| 91麻豆精品国产自产在线| 精品毛片乱码1区2区3区| 亚洲视频网在线直播| 99久久精品国产麻豆演员表| 亚洲日韩欧美一区二区在线| 欧美视频一区二| 国产一区视频网站| 亚洲精品国产第一综合99久久 | 日韩不卡手机在线v区| 日韩免费一区二区三区在线播放| 加勒比av一区二区| 亚洲免费伊人电影| 欧美成人女星排名| 91福利在线看| 波多野结衣中文字幕一区| 亚洲午夜电影在线观看| 国产视频在线观看一区二区三区| 成人福利电影精品一区二区在线观看| 亚洲欧美日韩在线| 2021中文字幕一区亚洲| 欧美日韩精品一区二区天天拍小说 | 99精品久久只有精品| 久久国产成人午夜av影院| 日韩理论在线观看| 久久精品人人做人人爽人人| 欧美在线|欧美| 亚洲一区二区三区中文字幕在线| 久久综合久色欧美综合狠狠| 欧美乱妇23p| 欧美精品一二三| 欧美喷潮久久久xxxxx| 在线观看视频欧美| 欧美在线视频不卡| 欧美麻豆精品久久久久久| 在线免费观看视频一区| 一本到三区不卡视频| 无码av中文一区二区三区桃花岛| 中文字幕乱码久久午夜不卡| 国产三级精品在线| 亚洲乱码国产乱码精品精可以看 | 欧美一区二区三区婷婷月色| 欧美久久久久免费| 欧美一区二区三区人| 精品国产凹凸成av人网站| 久久久久久日产精品| 亚洲私人影院在线观看| 亚洲综合丁香婷婷六月香| 亚洲国产一区视频| 国产在线精品一区二区夜色| 中文字幕国产一区| 一区二区三区国产| 国产美女精品在线| 在线播放视频一区| 国产日韩精品视频一区| 亚洲综合视频在线| 国产乱人伦偷精品视频不卡 | 在线观看国产精品网站| 欧美巨大另类极品videosbest | 久久久久久黄色| 亚洲精品国产一区二区三区四区在线 | 国内一区二区在线| 日韩免费观看高清完整版| 亚洲男同1069视频| 懂色av一区二区三区蜜臀| 欧美精品乱码久久久久久| 国产欧美日韩精品在线| 日本不卡一区二区三区| 色综合av在线| 中文字幕一区二区日韩精品绯色 | 久久婷婷一区二区三区| 久久超碰97人人做人人爱| 在线播放91灌醉迷j高跟美女| 国产精品美日韩| 亚洲激情综合网| 99热国产精品| 香蕉久久一区二区不卡无毒影院| 色天天综合色天天久久| 亚洲女厕所小便bbb| 91国内精品野花午夜精品| 亚洲素人一区二区| 欧美日韩精品欧美日韩精品一| 一区二区三区国产豹纹内裤在线| 91在线播放网址| 日韩成人精品视频| 国产欧美日韩精品在线| 91丨国产丨九色丨pron| 亚洲国产精品人人做人人爽| 欧美丰满高潮xxxx喷水动漫| 轻轻草成人在线| 综合激情成人伊人| 91精品国产91久久久久久一区二区| 日韩av网站在线观看| 国产片一区二区| 制服丝袜亚洲色图| 91在线视频播放| 韩国一区二区三区| 亚洲一区二区三区自拍| 久久精品亚洲精品国产欧美 | 亚洲国产精品精华液网站| 26uuu精品一区二区三区四区在线 26uuu精品一区二区在线观看 | 欧美一区二区三区免费大片| 成人免费视频视频| 极品尤物av久久免费看| 午夜影院在线观看欧美| 1区2区3区欧美| 国产精品国产a| 色婷婷久久久亚洲一区二区三区| 久久精品国产99久久6| 亚洲福利一二三区| 一区二区三区四区高清精品免费观看| 亚洲国产成人一区二区三区| 久久老女人爱爱| 亚洲国产精品成人综合色在线婷婷 | 国产河南妇女毛片精品久久久 | 国产精品18久久久久久久网站|