<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        吞吐量提升5倍,聯合設計后端系統和前端語言的LLM接口來了

        AIGC動態1年前 (2024)發布 機器之心
        530 0 0

        吞吐量提升5倍,聯合設計后端系統和前端語言的LLM接口來了

        AIGC動態歡迎閱讀

        原標題:吞吐量提升5倍,聯合設計后端系統和前端語言的LLM接口來了
        關鍵字:緩存,報告,張量,系統,基數
        文章來源:機器之心
        內容字數:5919字

        內容摘要:


        機器之心報道
        機器之心編輯部大型語言模型 (LLM) 越來越多地用于需要多個鏈式生成調用、高級 prompt 技術、控制流以及與外部環境交互的復雜任務。然而,用于編程和執行這些應用程序的現有高效系統存在著明顯的缺陷。
        現在,開源社區的研究者們面向 LLM 提出了一種結構化生成語言(Structured Generation Language)——SGLang。SGLang 能夠增強與 LLM 的交互,通過聯合設計后端運行時系統和前端語言,使 LLM 更快、更可控。機器學習領域知名學者、CMU 助理教授陳天奇還轉發了這項研究。總的來說,SGLang 的貢獻主要包括:
        在后端,研究團隊提出了 RadixAttention,這是一種跨多個 LLM 生成調用的 KV 緩存(KV cache)復用技術,自動且高效。
        在前端,研究團隊開發了一種嵌入 Python 的、靈活的域指定(domain-specific)語言來控制生成過程。該語言可以在解釋器模式或編譯器模式下執行。
        后端前端組件協同工作,可提高復雜 LLM 程序的執行和編程效率。
        該研究使用 SGLang 實現了常見的 LLM 工作負載,


        原文鏈接:吞吐量提升5倍,聯合設計后端系統和前端語言的LLM接口來了

        聯系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲中文字幕无码一去台湾| 亚洲今日精彩视频| 亚洲精品无码一区二区| 无码国产精品一区二区免费I6| 久久亚洲春色中文字幕久久久| 日本高清不卡aⅴ免费网站| 亚洲中文字幕无码一区二区三区| 一区二区三区免费视频观看| 亚洲中文字幕无码日韩| 一区二区三区无码视频免费福利 | 亚洲乱码无限2021芒果| 日日麻批免费40分钟日本的| 亚洲一级高清在线中文字幕| 无码人妻一区二区三区免费手机 | 成人影片麻豆国产影片免费观看| 亚洲人精品亚洲人成在线| 午夜无遮挡羞羞漫画免费| 亚洲国产成人AV网站| 亚洲精品美女久久久久99小说| 成人A毛片免费观看网站| 久久亚洲伊人中字综合精品| MM131亚洲国产美女久久| eeuss影院免费直达入口| 久久亚洲私人国产精品| 青青青免费国产在线视频小草| 亚洲国产精品嫩草影院| 亚洲女同成人AⅤ人片在线观看 | 国产高清不卡免费在线| 亚洲精品无码久久久久牙蜜区| 亚洲欧洲日产国码高潮αv| 午夜精品射精入后重之免费观看 | 亚洲中文字幕不卡无码| 久久免费看黄a级毛片| 国产精品久久久久久亚洲影视| 亚洲中文字幕无码永久在线| 午夜福利不卡片在线播放免费| 极品美女一级毛片免费| 亚洲综合无码一区二区| 国产hs免费高清在线观看| 一级毛片免费不卡在线| 极品色天使在线婷婷天堂亚洲|