<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Kimi開源推理框架:僅用1小時,GitHub攬獲1.2k星,揭秘其成功秘訣!

        AIGC動態5個月前發布 量子位
        443 0 0

        參與開源的還有阿里云、華為存儲、面壁智能、趨境科技等

        Kimi開源推理框架:僅用1小時,GitHub攬獲1.2k星,揭秘其成功秘訣!

        原標題:Kimi開源底層推理框架,1小時GitHub攬星1.2k
        文章來源:量子位
        內容字數:3445字

        Kimi底層推理架構Mooncake開源

        近日,Kimi底層推理架構Mooncake正式宣布開源,該架構承載了Kimi線上80%以上的流量。此次開源由月之暗面Kimi與清華大學等機構聯合發布,采用分階段的方式逐步開放高性能KVCache多級緩存Mooncake Store的實現,并兼容各類推理引擎及底層存儲/傳輸資源。

        1. Mooncake的核心技術

        Mooncake系統基于KVCache中心的解耦架構,分離了預填充集群與解碼集群,充分利用了GPU集群中的CPU、DRAM和SSD資源。其調度程序旨在平衡整體吞吐量與延遲相關的服務級別目標(SLO)。在流量高峰期,Mooncake通過早期拒絕策略和預測未來負載的方法來有效應對超載問題。

        2. 提升推理性能

        根據論文實驗結果,Mooncake在某些模擬場景中可實現高達525%的吞吐量提升,同時遵守SLO標準。在實際工作負載下,Mooncake使Kimi能夠處理超過75%的請求。許欣然表示,目前該系統承擔了Kimi線上80%以上的流量,極大提升了用戶體驗并降低了運營成本。

        3. 開源項目的前景

        為了加速Mooncake技術框架的應用與推廣,Kimi聯合多家機構發布了開源項目,參與方包括AISoft、阿里云、華為存儲等。Mooncake項目將為大模型時代構建新的高性能內存語義存儲標準接口,鼓勵更多企業與研究機構共同探索高效的模型推理系統架構創新。

        4. 結論

        Mooncake的開源標志著在大模型推理技術領域的一個重要進展,未來有望推動整個行業向更高效的推理平臺發展。開發者和研究者可以通過GitHub獲取Mooncake的相關資源,參與到這一創新項目中。


        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 一本色道久久88—综合亚洲精品| 亚洲第一永久AV网站久久精品男人的天堂AV | 亚洲国产精品国自产拍AV| 成a人片亚洲日本久久| 免费看AV毛片一区二区三区| 中国china体内裑精亚洲日本| 国产福利在线免费| 亚洲精品中文字幕无乱码麻豆| 99在线精品视频观看免费| 久久精品国产亚洲αv忘忧草| av免费不卡国产观看| 亚洲日韩精品国产3区| 日本a级片免费看| 一区二区免费在线观看| 国内精品久久久久久久亚洲| 国产一精品一AV一免费| 久久亚洲AV成人无码国产| 免费A级毛片无码无遮挡内射| 亚洲 暴爽 AV人人爽日日碰| 在线jyzzjyzz免费视频| 免费的黄网站男人的天堂| 中文字幕亚洲日本岛国片| 波多野结衣免费一区视频| 亚洲精品日韩专区silk| 天天看免费高清影视| 成人精品综合免费视频| 久久久久亚洲av无码尤物| 免费在线看v网址| 真人无码作爱免费视频| 亚洲爆乳精品无码一区二区三区| 99re6在线视频精品免费下载| 亚洲一区二区三区国产精品无码| 免费国产高清视频| 在线看片免费人成视频久网下载| 中文字幕亚洲免费无线观看日本| 永久免费毛片手机版在线看| 久久久久久久国产免费看| 亚洲av无码一区二区三区天堂古代 | 一本天堂ⅴ无码亚洲道久久| 久久亚洲AV永久无码精品| 国产精品色拉拉免费看|