<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        GPT-4可能也在用的推測解碼是什么?一文綜述前世今生和應(yīng)用情況

        AIGC動態(tài)1年前 (2024)發(fā)布 機(jī)器之心
        417 0 0

        GPT-4可能也在用的推測解碼是什么?一文綜述前世今生和應(yīng)用情況

        AIGC動態(tài)歡迎閱讀

        原標(biāo)題:GPT-4可能也在用的推測解碼是什么?一文綜述前世今生和應(yīng)用情況
        關(guān)鍵字:模型,報告,算法,語言,目標(biāo)
        文章來源:機(jī)器之心
        內(nèi)容字?jǐn)?shù):5496字

        內(nèi)容摘要:


        機(jī)器之心報道
        機(jī)器之心編輯部推測解碼(Speculative Decoding)是谷歌等機(jī)構(gòu)在 2022 年發(fā)現(xiàn)的大模型推理加速方法。它可以在不損失生成效果前提下,獲得 3 倍以上的加速比。GPT-4 泄密報告也提到 OpenAI 線上模型推理使用了它。針對如此妙的方法,香港理工大學(xué)、北京大學(xué)、MSRA 以及阿里共同推出了一篇關(guān)于推測解碼的綜述, 幫助讀者了解推測解碼的前世今生和應(yīng)用情況,值得一讀。眾所周知,大型語言模型(LLM)的推理通常需要使用自回歸采樣,這個推理過程相當(dāng)緩慢。為了解決這個問題,推測解碼(Speculative Decoding)已經(jīng)成為 LLM 推理的一種新型采樣方法。這種方法在每個采樣步驟中,會先預(yù)測幾個可能的 token,然后并行地驗證是否準(zhǔn)確。與自回歸解碼不同,推測解碼能夠單步解碼多個 token,從而加速推理。
        雖然推測解碼可以大有作為,但也引出了一些需要進(jìn)一步調(diào)研的關(guān)鍵問題。首先需要考慮如何選擇或設(shè)計近似模型,以在推測準(zhǔn)確性和生成效率之間取得平衡。其次,有必要考慮評估標(biāo)準(zhǔn)是否能夠保持生成多樣性和輸出質(zhì)量。最后,應(yīng)仔細(xì)考慮對齊近似模型和目標(biāo)大模型之間的推理


        原文鏈接:GPT-4可能也在用的推測解碼是什么?一文綜述前世今生和應(yīng)用情況

        聯(lián)系作者

        文章來源:機(jī)器之心
        作者微信:almosthuman2014
        作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: www国产亚洲精品久久久 | 亚洲性无码av在线| 亚洲真人日本在线| 日本久久久免费高清| 色欲A∨无码蜜臀AV免费播 | 亚洲一区在线免费观看| 黄色短视频免费看| 小说专区亚洲春色校园| 国产精品高清视亚洲一区二区| 好看的亚洲黄色经典| 亚洲精品天堂成人片?V在线播放| 免费无码肉片在线观看| 亚洲精品视频免费在线观看| 国产无遮挡裸体免费视频在线观看| 污污污视频在线免费观看| 亚洲AV无码片一区二区三区| 91丁香亚洲综合社区| 亚洲精品乱码久久久久久下载| 亚洲成Av人片乱码色午夜| 国产综合亚洲专区在线| 亚洲国产日韩在线观频| 亚洲国产精品无码久久青草| 俄罗斯极品美女毛片免费播放| 国产成人一区二区三区免费视频| 女人被弄到高潮的免费视频| 中文字幕无码视频手机免费看| 天天影视色香欲综合免费| 99久久免费中文字幕精品| 免费91最新地址永久入口 | 国产亚洲情侣一区二区无码AV| 免费国产成人午夜私人影视| 国产特级淫片免费看| 国产精品免费_区二区三区观看| 免费高清在线爱做视频| 日本高清免费不卡视频| 日本成人在线免费观看| 免费看一级做a爰片久久| 四虎国产精品免费视| 免费国产一级特黄久久| 亚洲精品国精品久久99热| 国产精品亚洲不卡一区二区三区 |