<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        一次預測多個token,Meta新模型推理加速3倍,編程任務提高17%

        AIGC動態1年前 (2024)發布 量子位
        493 0 0

        一次預測多個token,Meta新模型推理加速3倍,編程任務提高17%

        AIGC動態歡迎閱讀

        原標題:一次預測多個token,Meta新模型推理加速3倍,編程任務提高17%
        關鍵字:模型,團隊,任務,自然語言,字節
        文章來源:量子位
        內容字數:2772字

        內容摘要:


        夢晨 西風 發自 凹非寺量子位 | 公眾號 QbitAI“預測下一個token”被認為是大模型的基本范式,一次預測多個tokens又會怎樣?
        Meta AI法國團隊推出“基于多token預測的更快&更好大模型”。
        多token預測模型,在編程類任務上表現尤其突出。
        與單token預測相比,13B參數模型在HumanEval上多解決了12%的問題,在MBPP上多解決了17%。
        小型算法推理任務上,多token預測也在分布外泛化方面帶來了令人印象深刻的收益。
        不過在自然語言任務上,多token預測方法并不能顯著提高7B模型在數學選擇題上的表現了。
        另外一個好處是,即使batch size較大,使用4-token預測訓練的模型,推理速度也可提高3倍。
        多token預測更適合編程具體來說,團隊設計了一種新的多token預測架構,通過n個的輸出頭并行預測n個未來token。
        使用大量文本數據進行模型訓練,包括代碼和自然語言數據集。
        再通過實驗比較多token預測和單token預測在多個下游任務上的性能。
        為啥多token預測在編程任務和小型算法推理任務上提升更明顯?
        團隊猜測可能有兩個原因:


        原文鏈接:一次預測多個token,Meta新模型推理加速3倍,編程任務提高17%

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 无码成A毛片免费| jyzzjyzz国产免费观看| 一区二区三区福利视频免费观看| 免费人妻av无码专区| 精品亚洲AV无码一区二区三区 | 久久亚洲精品中文字幕| 国产福利免费视频| 中文字幕久久亚洲一区| 精品国产免费一区二区三区| 国产一区二区三区在线观看免费| 亚洲日韩欧洲无码av夜夜摸| 免费人成大片在线观看播放电影| 日韩免费的视频在线观看香蕉| 免费观看无遮挡www的小视频| 欧美三级在线电影免费| 亚洲韩国—中文字幕| 1区2区3区产品乱码免费| 亚洲高清视频在线播放| 色se01短视频永久免费| 亚洲天堂2017无码中文| 可以免费观看一级毛片黄a| caoporm碰最新免费公开视频| 91免费福利精品国产| 亚洲人成黄网在线观看| 国产精品成人无码免费| 成年网在线观看免费观看网址 | 久久成人免费大片| 亚洲国产成人综合| 四虎成人免费网站在线| 四虎影视久久久免费| 亚洲成人在线网站| 午夜一区二区免费视频| 老司机精品免费视频| 亚洲天堂一区二区三区| 亚洲人妖女同在线播放| 亚洲Av无码国产情品久久| 99热免费在线观看| 国产精品亚洲AV三区| 亚洲av不卡一区二区三区| 韩国欧洲一级毛片免费 | 亚洲一区二区三区首页|