<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        吞吐量提升5倍,聯合設計后端系統和前端語言的LLM接口來了

        AIGC動態2年前 (2024)發布 機器之心
        542 0 0

        吞吐量提升5倍,聯合設計后端系統和前端語言的LLM接口來了

        AIGC動態歡迎閱讀

        原標題:吞吐量提升5倍,聯合設計后端系統和前端語言的LLM接口來了
        關鍵字:緩存,報告,張量,系統,基數
        文章來源:機器之心
        內容字數:5919字

        內容摘要:


        機器之心報道
        機器之心編輯部大型語言模型 (LLM) 越來越多地用于需要多個鏈式生成調用、高級 prompt 技術、控制流以及與外部環境交互的復雜任務。然而,用于編程和執行這些應用程序的現有高效系統存在著明顯的缺陷。
        現在,開源社區的研究者們面向 LLM 提出了一種結構化生成語言(Structured Generation Language)——SGLang。SGLang 能夠增強與 LLM 的交互,通過聯合設計后端運行時系統和前端語言,使 LLM 更快、更可控。機器學習領域知名學者、CMU 助理教授陳天奇還轉發了這項研究。總的來說,SGLang 的貢獻主要包括:
        在后端,研究團隊提出了 RadixAttention,這是一種跨多個 LLM 生成調用的 KV 緩存(KV cache)復用技術,自動且高效。
        在前端,研究團隊開發了一種嵌入 Python 的、靈活的域指定(domain-specific)語言來控制生成過程。該語言可以在解釋器模式或編譯器模式下執行。
        后端前端組件協同工作,可提高復雜 LLM 程序的執行和編程效率。
        該研究使用 SGLang 實現了常見的 LLM 工作負載,


        原文鏈接:吞吐量提升5倍,聯合設計后端系統和前端語言的LLM接口來了

        聯系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 日本免费xxxx色视频| 一级毛片免费视频| avtt亚洲天堂| 亚洲国产欧洲综合997久久| 日韩一区二区a片免费观看| 亚洲AV无码乱码在线观看代蜜桃| 国产乱子精品免费视观看片| 亚洲国产精品专区| 18禁无遮挡无码网站免费| 亚洲中文字幕久久精品无码VA | 亚洲国产精品综合久久2007| 亚洲免费视频网址| 亚洲人成77777在线播放网站不卡| 免费人成视频在线| 青青青亚洲精品国产| 国产偷窥女洗浴在线观看亚洲 | 久久亚洲中文字幕精品一区四 | 无码亚洲成a人在线观看| 国产午夜无码视频免费网站| 一二三区免费视频| 亚洲国产精品无码专区| 最近中文字幕完整免费视频ww| 亚洲三级在线免费观看| 免费看a级黄色片| 国产V片在线播放免费无码| 亚洲国产成人久久综合一| 亚洲色无码专区一区| 四虎影在线永久免费四虎地址8848aa | 5555在线播放免费播放| 亚洲精品无码专区久久| 狠狠综合久久综合88亚洲| 免费在线观看h片| 国产亚洲精彩视频| 亚洲国产精品一区二区久久| 在线观看成人免费视频| 国产精品黄页免费高清在线观看| 久久精品国产亚洲av水果派 | 亚洲国产V高清在线观看| 国产免费阿v精品视频网址| 亚洲日本人成中文字幕| 久久精品国产精品亚洲人人 |