<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        預(yù)測token速度翻番!Transformer新解碼算法火了,來自小羊駝團(tuán)隊|代碼已開源

        AIGC動態(tài)1年前 (2023)發(fā)布 量子位
        672 0 0

        預(yù)測token速度翻番!Transformer新解碼算法火了,來自小羊駝團(tuán)隊|代碼已開源

        AIGC動態(tài)歡迎閱讀

        原標(biāo)題:預(yù)測token速度翻番!Transformer新解碼算法火了,來自小羊駝團(tuán)隊|代碼已開源

        關(guān)鍵字:模型,步驟,小羊,算法,作者

        文章來源:量子位

        內(nèi)容字?jǐn)?shù):4604字

        內(nèi)容摘要:豐色 發(fā)自 凹非寺量子位 | 公眾號QbitAI小羊駝團(tuán)隊的新研究火了。他們開發(fā)了一種新的解碼算法,可以讓模型預(yù)測100個token數(shù)的速度提高1.5-2.3倍,進(jìn)而加速LLM推理。比如這是同一個模型(LLaMa-2-Chat 7B)面對同一個用戶提問(蘇格拉底采用了哪些方法來挑戰(zhàn)他那個時代的主流思想?)時輸出回答的速度:左邊為原算法,耗時18.12s,每秒約35個token;右邊為該算法,耗時10.4s,每秒約60個token,明顯快了一大截。簡單來說,這是一種并行解碼算法,名叫“Lookahead Decoding”(前向解碼)。它主要利用雅可比(Jacobi)迭代法首次打破自回歸解碼中的順序依賴性(眾所周知,當(dāng)下大模型基本都是基于自回歸的Transformer)。由此無需草稿模型(draft model)或數(shù)據(jù)存儲,就可以減少解碼步驟,加速LLM推理。目前,作者已給出了與huggin…

        原文鏈接:點此閱讀原文:預(yù)測token速度翻番!Transformer新解碼算法火了,來自小羊駝團(tuán)隊|代碼已開源

        聯(lián)系作者

        文章來源:量子位

        作者微信:QbitAI

        作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 十九岁在线观看免费完整版电影| 亚洲精品无码少妇30P| 一级做α爱过程免费视频| 午夜一级毛片免费视频| 精品国产日韩久久亚洲| 国产精品色拉拉免费看| 亚洲制服丝袜一区二区三区| 精品成在人线AV无码免费看| 亚洲一区二区中文| 三级毛片在线免费观看| 国产成A人亚洲精V品无码性色| 精品亚洲永久免费精品| 99久久亚洲精品无码毛片| 四虎精品视频在线永久免费观看| 亚洲国产午夜精品理论片| 免费毛片在线播放| 深夜福利在线视频免费| 国产亚洲成av人片在线观看| 91免费国产精品| 亚洲欧洲AV无码专区| 亚洲av午夜成人片精品电影 | 波多野结衣久久高清免费| 黄色免费网站在线看| 亚洲AV综合色区无码一区| 91频在线观看免费大全| 亚洲精品无码专区| 2048亚洲精品国产| 1区2区3区产品乱码免费| 亚洲乱妇老熟女爽到高潮的片| 亚洲乱码中文字幕综合234| 日韩人妻无码精品久久免费一| 狠狠色香婷婷久久亚洲精品| 免费永久国产在线视频| 免费日本一区二区| 亚洲高清一区二区三区电影| 久久久青草青青国产亚洲免观| 91在线老王精品免费播放| 人成午夜免费大片在线观看| 2022年亚洲午夜一区二区福利| 国产乱子伦精品免费无码专区| 亚洲午夜免费视频|