<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Kimi開源推理框架:僅用1小時,GitHub攬獲1.2k星,揭秘其成功秘訣!

        AIGC動態10個月前發布 量子位
        452 0 0

        參與開源的還有阿里云、華為存儲、面壁智能、趨境科技等

        Kimi開源推理框架:僅用1小時,GitHub攬獲1.2k星,揭秘其成功秘訣!

        原標題:Kimi開源底層推理框架,1小時GitHub攬星1.2k
        文章來源:量子位
        內容字數:3445字

        Kimi底層推理架構Mooncake開源

        近日,Kimi底層推理架構Mooncake正式宣布開源,該架構承載了Kimi線上80%以上的流量。此次開源由月之暗面Kimi與清華大學等機構聯合發布,采用分階段的方式逐步開放高性能KVCache多級緩存Mooncake Store的實現,并兼容各類推理引擎及底層存儲/傳輸資源。

        1. Mooncake的核心技術

        Mooncake系統基于KVCache中心的解耦架構,分離了預填充集群與解碼集群,充分利用了GPU集群中的CPU、DRAM和SSD資源。其調度程序旨在平衡整體吞吐量與延遲相關的服務級別目標(SLO)。在流量高峰期,Mooncake通過早期拒絕策略和預測未來負載的方法來有效應對超載問題。

        2. 提升推理性能

        根據論文實驗結果,Mooncake在某些模擬場景中可實現高達525%的吞吐量提升,同時遵守SLO標準。在實際工作負載下,Mooncake使Kimi能夠處理超過75%的請求。許欣然表示,目前該系統承擔了Kimi線上80%以上的流量,極大提升了用戶體驗并降低了運營成本。

        3. 開源項目的前景

        為了加速Mooncake技術框架的應用與推廣,Kimi聯合多家機構發布了開源項目,參與方包括AISoft、阿里云、華為存儲等。Mooncake項目將為大模型時代構建新的高性能內存語義存儲標準接口,鼓勵更多企業與研究機構共同探索高效的模型推理系統架構創新。

        4. 結論

        Mooncake的開源標志著在大模型推理技術領域的一個重要進展,未來有望推動整個行業向更高效的推理平臺發展。開發者和研究者可以通過GitHub獲取Mooncake的相關資源,參與到這一創新項目中。


        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚欧色视频在线观看免费| 国产免费人成视频尤勿视频| 免费A级毛片无码A∨| 国产亚洲人成网站在线观看不卡 | 亚洲一级特黄大片无码毛片| 亚洲乱色伦图片区小说| 成人黄动漫画免费网站视频 | 野花香高清在线观看视频播放免费| 亚洲男人的天堂在线va拉文| 免费人成大片在线观看播放电影| 免费成人在线观看| xxxx日本在线播放免费不卡| 亚洲天堂中文字幕在线| 国产一级高青免费| 亚洲天堂中文资源| 99视频在线精品免费观看6| 一本天堂ⅴ无码亚洲道久久| 国产极品美女高潮抽搐免费网站| 国产亚洲综合久久| 国产成人A亚洲精V品无码| 高清一区二区三区免费视频| 激情内射亚洲一区二区三区| 亚洲欧洲免费无码| 特级毛片A级毛片100免费播放 | 国产猛烈高潮尖叫视频免费| 亚洲免费在线观看| 久久99国产亚洲精品观看| 中文字幕无码播放免费| 亚洲精品宾馆在线精品酒店| 亚洲一区精品伊人久久伊人| 国产婷婷成人久久Av免费高清| 亚洲精品视频免费看| 在线日韩av永久免费观看| 久久久久久久久久免免费精品| 久久精品a亚洲国产v高清不卡| 野花高清在线电影观看免费视频| 成人国产网站v片免费观看| 色婷婷六月亚洲婷婷丁香| 夭天干天天做天天免费看| 本免费AV无码专区一区| 亚洲一级黄色大片|