<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        400萬token上下文、推理再加速46%!最新開源方案升級(jí)MIT成果,推理成本再降低

        AIGC動(dòng)態(tài)1年前 (2024)發(fā)布 量子位
        377 0 0

        400萬token上下文、推理再加速46%!最新開源方案升級(jí)MIT成果,推理成本再降低

        AIGC動(dòng)態(tài)歡迎閱讀

        原標(biāo)題:400萬token上下文、推理再加速46%!最新開源方案升級(jí)MIT成果,推理成本再降低
        關(guān)鍵字:模型,注意力,窗口,效果,機(jī)制
        文章來源:量子位
        內(nèi)容字?jǐn)?shù):4665字

        內(nèi)容摘要:


        明敏 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI22倍加速還不夠,再來提升46%,而且方法直接開源!
        這就是開源社區(qū)改進(jìn)MIT爆火項(xiàng)目StreamingLLM的最新成果。
        StreamingLLM可以在不犧牲生成效果、推理速度的前提下,實(shí)現(xiàn)多輪對(duì)話共400萬個(gè)token,22.2倍推理速度提升。
        該項(xiàng)目在上線不到3個(gè)月時(shí)間內(nèi),GitHub項(xiàng)目標(biāo)星達(dá)到5.7k star。
        不過,StreamingLLM使用原生PyTorch實(shí)現(xiàn),對(duì)于多輪對(duì)話推理場景落地應(yīng)用的低成本、低延遲、高吞吐等需求仍有優(yōu)化空間。
        Colossal-AI團(tuán)隊(duì)開源了SwiftInfer,基于TensorRT的StreamingLLM,可以進(jìn)一步提升大模型推理性能46%,有效解決如上問題。
        具體如何實(shí)現(xiàn)?一起來看。
        開源地址:https://github.com/hpcaitech/SwiftInfer
        StreamingLLM如何實(shí)現(xiàn)超長多輪對(duì)話?大語言模型能夠記住的上下文長度,直接影響了ChatGPT等大模型應(yīng)用與用戶互動(dòng)的質(zhì)量。
        如何讓LLM在多輪對(duì)話場景下保持生成質(zhì)量,對(duì)推理系統(tǒng)提出了更高的要求,因?yàn)長LM在預(yù)


        原文鏈接:400萬token上下文、推理再加速46%!最新開源方案升級(jí)MIT成果,推理成本再降低

        聯(lián)系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評(píng)論

        暫無評(píng)論...
        主站蜘蛛池模板: 又粗又大又黑又长的免费视频| 中文字幕乱码免费看电影| 99免费观看视频| 国产精品亚洲A∨天堂不卡| 成人免费乱码大片A毛片| 亚洲色偷拍另类无码专区| 一级日本高清视频免费观看| 亚洲国产精品成人久久蜜臀| 色老头综合免费视频| 亚洲一级黄色视频| 国产成人免费ā片在线观看老同学| 亚洲综合伊人久久综合| a级男女仿爱免费视频| 久久精品国产精品亚洲艾| 亚洲欧洲免费视频| 91亚洲国产成人久久精品网址| 亚洲国产综合无码一区| 免费看搞黄视频网站| 亚洲精彩视频在线观看| 女人18毛片特级一级免费视频 | 在线观看成人免费视频不卡| 亚洲电影在线播放| 女人18毛片特级一级免费视频| 羞羞的视频在线免费观看| 一本色道久久综合亚洲精品| 久久精品无码专区免费青青| gogo全球高清大胆亚洲| 日韩精品无码免费专区午夜| 亚洲国产成人精品无码区在线网站| 成人片黄网站色大片免费| 污污污视频在线免费观看| 亚洲AV成人一区二区三区AV| 无人在线观看完整免费版视频| 国产亚洲视频在线播放大全| 亚洲妇熟XXXX妇色黄| 欧美大尺寸SUV免费| 男人j进女人p免费视频| 亚洲一区二区在线视频| 男人的天堂亚洲一区二区三区 | 亚洲成?v人片天堂网无码| a视频在线观看免费|