<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        刷榜「代碼生成」任務!復旦等發布StepCoder框架:從編譯器反饋信號中強化學習

        AIGC動態1年前 (2024)發布 新智元
        405 0 0

        刷榜「代碼生成」任務!復旦等發布StepCoder框架:從編譯器反饋信號中強化學習

        AIGC動態歡迎閱讀

        原標題:刷榜「代碼生成」任務!復旦等發布StepCoder框架:從編譯器反饋信號中強化學習
        關鍵字:代碼,模型,研究人員,任務,數據
        文章來源:新智元
        內容字數:11225字

        內容摘要:


        新智元報道編輯:LRS
        【新智元導讀】StepCoder將長序列代碼生成任務分解為代碼完成子任務課程來緩解強化學習探索難題,對未執行的代碼段以細粒度優化;還開源了可用于強化學習訓練的APPS+數據集。大型語言模型(LLMs)的發展極大地推動了代碼生成領域的發展,之前有工作將強化學習(RL)與編譯器的反饋信號集成在一起,用于探索LLMs的輸出空間,以提高代碼生成質量。
        但當下還存在兩個問題:
        1. 強化學習探索很難直接適配到「復雜的人類需求」,即要求LLMs生成「長序列代碼」;
        2. 由于單元測試可能無法覆蓋復雜的代碼,因此使用未執行的代碼片段來優化LLMs是無效的。
        為了解決這些挑戰,復旦大學、華中科技大學、皇家理工學院的研究人員提出了一種用于代碼生成的新型強化學習框架StepCoder,由兩個主要組件組成:
        1. CCCS通過將長序列代碼生成任務分解為代碼完成子任務課程來解決探索挑戰;
        2. FGO通過屏蔽未執行的代碼段來優化模型,以提供細粒度優化。論文鏈接:https://arxiv.org/pdf/2402.01391.pdf
        項目鏈接:https://github.com/A


        原文鏈接:刷榜「代碼生成」任務!復旦等發布StepCoder框架:從編譯器反饋信號中強化學習

        聯系作者

        文章來源:新智元
        作者微信:AI_era
        作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产免费不卡视频| 国产精品99精品久久免费| 无码一区二区三区AV免费| 久久亚洲国产视频| 一级毛片免费视频| 亚洲日本在线观看| 亚洲免费观看网站| 亚洲啪啪免费视频| 女人张腿给男人桶视频免费版 | 高潮内射免费看片| 亚洲AⅤ优女AV综合久久久| 一个人免费观看视频在线中文| 亚洲人成色77777在线观看大| 一级做a毛片免费视频| 国产亚洲一区二区在线观看| 99久久国产精品免费一区二区 | 国产婷婷成人久久Av免费高清| 亚洲AV成人无码久久精品老人| 69视频免费在线观看| 国产精品亚洲四区在线观看| 在线免费观看一级毛片| 污污视频网站免费观看| 国产V亚洲V天堂无码| 免费专区丝袜脚调教视频| 亚洲熟女综合一区二区三区| 亚洲成a人片在线观看日本麻豆| a级毛片免费高清视频| 久久久无码精品亚洲日韩蜜臀浪潮 | 亚洲天堂电影在线观看| 国产精品成人免费一区二区| 美女黄频视频大全免费的| 亚洲国产婷婷六月丁香| 波多野结衣免费在线观看| 国产在亚洲线视频观看| 国产亚洲精品a在线观看app| 亚洲视频免费播放| 免费很黄无遮挡的视频毛片| 亚洲人成在线观看| 日本久久久免费高清| 免费av片在线观看网站| 亚洲欧美成人综合久久久|