<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        一次預測多個token,Meta新模型推理加速3倍,編程任務提高17%

        AIGC動態1年前 (2024)發布 量子位
        493 0 0

        一次預測多個token,Meta新模型推理加速3倍,編程任務提高17%

        AIGC動態歡迎閱讀

        原標題:一次預測多個token,Meta新模型推理加速3倍,編程任務提高17%
        關鍵字:模型,團隊,任務,自然語言,字節
        文章來源:量子位
        內容字數:2772字

        內容摘要:


        夢晨 西風 發自 凹非寺量子位 | 公眾號 QbitAI“預測下一個token”被認為是大模型的基本范式,一次預測多個tokens又會怎樣?
        Meta AI法國團隊推出“基于多token預測的更快&更好大模型”。
        多token預測模型,在編程類任務上表現尤其突出。
        與單token預測相比,13B參數模型在HumanEval上多解決了12%的問題,在MBPP上多解決了17%。
        小型算法推理任務上,多token預測也在分布外泛化方面帶來了令人印象深刻的收益。
        不過在自然語言任務上,多token預測方法并不能顯著提高7B模型在數學選擇題上的表現了。
        另外一個好處是,即使batch size較大,使用4-token預測訓練的模型,推理速度也可提高3倍。
        多token預測更適合編程具體來說,團隊設計了一種新的多token預測架構,通過n個的輸出頭并行預測n個未來token。
        使用大量文本數據進行模型訓練,包括代碼和自然語言數據集。
        再通過實驗比較多token預測和單token預測在多個下游任務上的性能。
        為啥多token預測在編程任務和小型算法推理任務上提升更明顯?
        團隊猜測可能有兩個原因:


        原文鏈接:一次預測多個token,Meta新模型推理加速3倍,編程任務提高17%

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲中久无码不卡永久在线观看| 久久久久久久91精品免费观看| 四虎影视永久免费观看地址| 亚洲熟妇丰满xxxxx| 无码一区二区三区AV免费| 亚洲国产日韩综合久久精品| 毛片基地免费观看| 亚洲乱码在线卡一卡二卡新区| 一二三四影视在线看片免费| 国产成人精品日本亚洲专| 好吊妞在线新免费视频| 亚洲第一综合天堂另类专| 国产一级一片免费播放| 一级毛片a女人刺激视频免费| 色久悠悠婷婷综合在线亚洲| 很黄很污的网站免费| 亚洲综合小说久久另类区 | 国产一级在线免费观看| 亚洲国产精品无码久久久蜜芽| 久久免费视频观看| 亚洲福利视频网址| 日韩人妻无码免费视频一区二区三区 | 9420免费高清在线视频| 亚洲a级片在线观看| 精品国产免费观看| 中文字幕在线观看免费| 97se亚洲综合在线| 国产精品成人无码免费| 又粗又黄又猛又爽大片免费 | 亚洲男女性高爱潮网站| 成人a视频片在线观看免费| 青青青视频免费观看| 亚洲AV中文无码乱人伦下载| 免费影院未满十八勿进网站| 成人一级免费视频| 亚洲欧洲国产经精品香蕉网| 日韩精品电影一区亚洲| 最近免费中文在线视频| 粉色视频免费入口| 亚洲一区精品视频在线| 色久悠悠婷婷综合在线亚洲|