<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        吞吐量提升5倍,聯合設計后端系統和前端語言的LLM接口來了

        AIGC動態1年前 (2024)發布 機器之心
        530 0 0

        吞吐量提升5倍,聯合設計后端系統和前端語言的LLM接口來了

        AIGC動態歡迎閱讀

        原標題:吞吐量提升5倍,聯合設計后端系統和前端語言的LLM接口來了
        關鍵字:緩存,報告,張量,系統,基數
        文章來源:機器之心
        內容字數:5919字

        內容摘要:


        機器之心報道
        機器之心編輯部大型語言模型 (LLM) 越來越多地用于需要多個鏈式生成調用、高級 prompt 技術、控制流以及與外部環境交互的復雜任務。然而,用于編程和執行這些應用程序的現有高效系統存在著明顯的缺陷。
        現在,開源社區的研究者們面向 LLM 提出了一種結構化生成語言(Structured Generation Language)——SGLang。SGLang 能夠增強與 LLM 的交互,通過聯合設計后端運行時系統和前端語言,使 LLM 更快、更可控。機器學習領域知名學者、CMU 助理教授陳天奇還轉發了這項研究。總的來說,SGLang 的貢獻主要包括:
        在后端,研究團隊提出了 RadixAttention,這是一種跨多個 LLM 生成調用的 KV 緩存(KV cache)復用技術,自動且高效。
        在前端,研究團隊開發了一種嵌入 Python 的、靈活的域指定(domain-specific)語言來控制生成過程。該語言可以在解釋器模式或編譯器模式下執行。
        后端前端組件協同工作,可提高復雜 LLM 程序的執行和編程效率。
        該研究使用 SGLang 實現了常見的 LLM 工作負載,


        原文鏈接:吞吐量提升5倍,聯合設計后端系統和前端語言的LLM接口來了

        聯系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲成av人片不卡无码| 亚洲av中文无码乱人伦在线r▽| 亚洲五月六月丁香激情| 久久国产精品萌白酱免费| 亚洲大成色www永久网站| 嫩草成人永久免费观看| 亚洲国产精品SSS在线观看AV| 精品视频一区二区三区免费| 亚洲成AV人在线观看天堂无码| 3344在线看片免费| 久久精品国产亚洲AV高清热| 很黄很黄的网站免费的| 日韩亚洲产在线观看| 国产成人免费a在线资源| 免费人成视频在线播放| 国产亚洲3p无码一区二区| 亚洲电影免费在线观看| 亚洲伊人久久大香线蕉啊| 狠狠久久永久免费观看| 牛牛在线精品观看免费正| 亚洲精品无码午夜福利中文字幕| 99蜜桃在线观看免费视频网站| 亚洲精品视频在线观看视频| 91在线视频免费看| 美女视频免费看一区二区| 久久久久亚洲av毛片大| 99re在线精品视频免费| 亚洲中文字幕精品久久| 国产亚洲人成A在线V网站| 88av免费观看| 另类小说亚洲色图| 久久久久亚洲精品影视| 大学生a级毛片免费观看| 国产精品美女久久久免费| 亚洲网红精品大秀在线观看| 麻豆精品国产免费观看| 国产偷伦视频免费观看| 亚洲人成网站在线在线观看| 国产成人亚洲综合色影视| 天天操夜夜操免费视频| 97人妻精品全国免费视频 |