<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        一次預測多個token,Meta新模型推理加速3倍,編程任務提高17%

        AIGC動態1年前 (2024)發布 量子位
        495 0 0

        一次預測多個token,Meta新模型推理加速3倍,編程任務提高17%

        AIGC動態歡迎閱讀

        原標題:一次預測多個token,Meta新模型推理加速3倍,編程任務提高17%
        關鍵字:模型,團隊,任務,自然語言,字節
        文章來源:量子位
        內容字數:2772字

        內容摘要:


        夢晨 西風 發自 凹非寺量子位 | 公眾號 QbitAI“預測下一個token”被認為是大模型的基本范式,一次預測多個tokens又會怎樣?
        Meta AI法國團隊推出“基于多token預測的更快&更好大模型”。
        多token預測模型,在編程類任務上表現尤其突出。
        與單token預測相比,13B參數模型在HumanEval上多解決了12%的問題,在MBPP上多解決了17%。
        小型算法推理任務上,多token預測也在分布外泛化方面帶來了令人印象深刻的收益。
        不過在自然語言任務上,多token預測方法并不能顯著提高7B模型在數學選擇題上的表現了。
        另外一個好處是,即使batch size較大,使用4-token預測訓練的模型,推理速度也可提高3倍。
        多token預測更適合編程具體來說,團隊設計了一種新的多token預測架構,通過n個的輸出頭并行預測n個未來token。
        使用大量文本數據進行模型訓練,包括代碼和自然語言數據集。
        再通過實驗比較多token預測和單token預測在多個下游任務上的性能。
        為啥多token預測在編程任務和小型算法推理任務上提升更明顯?
        團隊猜測可能有兩個原因:


        原文鏈接:一次預測多個token,Meta新模型推理加速3倍,編程任務提高17%

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 一级中文字幕免费乱码专区| 美女视频黄频a免费观看| 免费无码又爽又刺激一高潮| 亚洲国产精品一区二区第四页| 亚洲日韩国产二区无码| 午夜一区二区免费视频| 午夜亚洲WWW湿好爽| av无码东京热亚洲男人的天堂| 欧洲乱码伦视频免费国产| 亚洲国产小视频精品久久久三级| 一级片在线免费看| 亚洲精品无码专区在线在线播放| 国产在线观a免费观看| 久久91亚洲人成电影网站| 亚洲免费网站在线观看| 亚洲日产乱码一二三区别| 国产一级淫片视频免费看| 国产免费伦精品一区二区三区| 亚洲gv白嫩小受在线观看| 国产精品永久免费10000| 亚洲国产精品成人AV在线| 亚洲精品视频免费| 8x网站免费入口在线观看| 最新国产成人亚洲精品影院| 在线免费观看a级片| 国产精品小视频免费无限app| 亚洲无删减国产精品一区| 99在线视频免费观看视频 | 一级特黄a大片免费| 亚洲av无码av制服另类专区| 国产h视频在线观看免费| 一级做a爰片性色毛片免费网站| 亚洲欧洲日韩国产综合在线二区| 国内免费高清在线观看| 一级做a爱过程免费视| 亚洲高清中文字幕| 国产又大又黑又粗免费视频 | 久久久久久国产精品免费免费| 男女啪啪免费体验区| 亚洲黄网站wwwwww| 亚洲日韩国产精品乱|