<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        顛覆性創新:XGrammar引擎助力LLM生成速度提升百倍,開銷幾近為零!

        AIGC動態10個月前發布 智猩猩GenAI
        440 0 0

        現在,大語言模型的結構化生成有了一個更加高效、靈活的引擎。

        顛覆性創新:XGrammar引擎助力LLM生成速度提升百倍,開銷幾近為零!

        原標題:陳天奇團隊LLM結構化生成新引擎XGrammar:百倍加速近零開銷
        文章來源:智猩猩GenAI
        內容字數:8316字

        2024中國生成式AI大會(上海站)預告

        2024中國生成式AI大會將于12月5-6日在上海舉行,主會場將舉辦大模型峰會和AI Infra峰會,分會場將進行端側生成式AI、AI視頻生成和具身智能的技術研討會,歡迎報名參加。

        新型結構化生成引擎:XGrammar

        針對目前大語言模型(LLM)在結構化生成上的效率問題,陳天奇團隊提出了XGrammar,一個高效、靈活且可移植的結構化生成引擎。XGrammar的目標是實現靈活、零開銷的結構化生成,支持多種格式如JSON和SQL。

        約束解碼的挑戰

        傳統的約束解碼方法使用上下文無關語法(CFG)來過濾無效token,但效率不高。XGrammar通過字節級下推自動機(PDA)和自適應token掩碼緩存顯著提升了性能,能夠將每個token的延遲降低100倍,并實現端到端LLM服務的速度提升80倍。

        XGrammar的實現與優化

        XGrammar利用預處理階段生成的自適應token掩碼緩存,加速運行時的掩碼生成。此外,通過上下文擴展和持續性執行堆棧等技術,進一步提升了效率。研究者還進行了多項結構優化,如規則內聯和下推自動機節點合并,以減少計算量。

        評估結果與跨平臺部署

        在評估中,XGrammar在JSON模式下實現了3倍的加速,復雜語法下的加速更是超過100倍。XGrammar還被成功編譯為WebAssembly,支持在多種平臺上進行高性能的結構化生成,顯示出了其廣泛的應用潛力。

        總結

        XGrammar的提出為大語言模型的結構化生成提供了新思路,通過多種優化顯著提高了效率,展現了在生成式AI領域的重要應用價值。歡迎關注即將舉辦的2024中國生成式AI大會,共同探索更多前沿技術。


        聯系作者

        文章來源:智猩猩GenAI
        作者微信:
        作者簡介:智猩猩旗下公眾號之一,深入關注大模型與AI智能體,及時搜羅生成式AI技術產品。

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产一精品一AV一免费| 亚洲综合另类小说色区| 亚洲男人电影天堂| 久久精品国产免费| 久久91亚洲精品中文字幕| 国产成年无码久久久免费| 久久亚洲精品成人综合| 美女在线视频观看影院免费天天看 | 日本免费在线观看| 亚洲人成人无码网www电影首页| 伊人久久国产免费观看视频| 在线观看亚洲免费| 免费无遮挡无码视频在线观看| 免费播放特黄特色毛片| 久久精品无码免费不卡| 亚洲AV日韩AV鸥美在线观看| 毛片免费全部播放无码| 97se亚洲国产综合自在线| 青草草在线视频永久免费| 鲁啊鲁在线视频免费播放| 亚洲色大成网站WWW久久九九| 免费国产成人α片| 亚洲免费电影网站| 亚洲第一成人影院| a级毛片在线视频免费观看| 亚洲欧洲第一a在线观看| 好男人视频在线观看免费看片| 无遮挡a级毛片免费看| 人人狠狠综合久久亚洲88| 3d动漫精品啪啪一区二区免费| 亚洲精品一卡2卡3卡四卡乱码| 亚洲人成无码www久久久| 亚洲一区免费观看| 亚洲6080yy久久无码产自国产| 亚洲伊人久久成综合人影院| 24小时日本电影免费看| 亚洲a无码综合a国产av中文| 国产亚洲无线码一区二区| 女人18毛片特级一级免费视频| 国产福利在线观看永久免费| 亚洲国产精品日韩在线|