<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        蘋果與英偉達強強聯(lián)手,打造超速AI響應新紀元!

        AIGC動態(tài)5個月前發(fā)布 愛范兒
        495 0 0

        蘋果與英偉達合作提高大模型推理效率。

        蘋果與英偉達強強聯(lián)手,打造超速AI響應新紀元!

        原標題:蘋果正在與英偉達合作,想讓 AI 的響應速度更快
        文章來源:愛范兒
        內容字數(shù):3184字

        蘋果與英偉達合作加速大模型推理性能

        近日,蘋果與英偉達宣布了一項合作,旨在提升大語言模型(LLM)的推理性能。這一合作的核心是蘋果開源的「ReDrafter」技術,旨在解決傳統(tǒng)自回歸 LLM 在推理效率和內存帶寬方面的不足。

        1. ReDrafter 的核心技術

        ReDrafter 通過三項關鍵技術提升推理速度:

        • RNN 草稿模型: 該模型利用循環(huán)神經(jīng)網(wǎng)絡(RNN)預測可能的 tokens 序列,能夠捕捉局部時間依賴性,提高預測準確性。
        • 動態(tài)樹注意力算法: 該算法優(yōu)化束搜索的候選序列,識別共享前綴,減少需要驗證的 tokens 數(shù)量,從而提高計算資源的利用效率。
        • 知識蒸餾訓練: 通過將大型 LLM 的知識轉移到更小的 RNN 草稿模型,提升了推理的準確性和效率。

        2. 推理速度的顯著提升

        蘋果的基準測試結果顯示,集成 ReDrafter 的 TensorRT-LLM 在 NVIDIA H100 GPU 上的貪心解碼速度提高了 2.7 倍,而在 M2 Ultra Metal GPU 上也實現(xiàn)了 2.3 倍的加速。這一提升不僅降低了計算成本,還減少了用戶端的延遲。

        3. 面向更廣泛的應用

        ReDrafter 的技術具有較小的 GPU 資源需求,能夠在資源受限的環(huán)境中高效運行,為 LLM 在多種硬件平臺的應用提供了新的可能性。蘋果已將這一技術開源,未來其他公司也可能從中獲益。

        總之,蘋果與英偉達的合作和 ReDrafter 的推出標志著大語言模型推理技術的一個重要進步,有助于推動生產(chǎn)應用程序的高效性和可用性。


        聯(lián)系作者

        文章來源:愛范兒
        作者微信:
        作者簡介:關注明日產(chǎn)品的數(shù)字潮牌

        閱讀原文
        ? 版權聲明
        Trae官網(wǎng)

        相關文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产91精品一区二区麻豆亚洲 | 亚洲国产成人久久综合| 亚洲伊人久久大香线蕉AV| 日日摸夜夜添夜夜免费视频| 不卡视频免费在线观看| 拨牐拨牐x8免费| 久久久久久a亚洲欧洲AV| 小说专区亚洲春色校园| 亚洲免费网站在线观看| 亚洲精品乱码久久久久66| 亚洲av无码偷拍在线观看| 24小时日本韩国高清免费| 中文字幕专区在线亚洲| 亚洲国产精品成人AV在线| 日本成人免费在线| 亚洲av乱码一区二区三区| 成人久久免费网站| 国产啪亚洲国产精品无码| 久久青草免费91观看| 亚洲中文字幕无码久久精品1| 精品国产亚洲一区二区三区在线观看| 日韩免费视频播播| 精品97国产免费人成视频| 亚洲高清无码专区视频| 黄色一级毛片免费看| 无码国模国产在线观看免费| 一区二区在线免费视频| 亚洲人成网站18禁止一区| 免费一级毛suv好看的国产网站| 日韩成人在线免费视频 | 久久精品国产96精品亚洲| 成人av片无码免费天天看| 91大神亚洲影视在线| 无码人妻一区二区三区免费看| 一本久久a久久精品亚洲| 7m凹凸精品分类大全免费| 亚洲网址在线观看| 黄色网址免费观看| 久久亚洲最大成人网4438| 久久综合AV免费观看| 亚洲欧美日韩中文高清www777|