<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        刷榜「代碼生成」任務!復旦等發布StepCoder框架:從編譯器反饋信號中強化學習

        AIGC動態2年前 (2024)發布 新智元
        407 0 0

        刷榜「代碼生成」任務!復旦等發布StepCoder框架:從編譯器反饋信號中強化學習

        AIGC動態歡迎閱讀

        原標題:刷榜「代碼生成」任務!復旦等發布StepCoder框架:從編譯器反饋信號中強化學習
        關鍵字:代碼,模型,研究人員,任務,數據
        文章來源:新智元
        內容字數:11225字

        內容摘要:


        新智元報道編輯:LRS
        【新智元導讀】StepCoder將長序列代碼生成任務分解為代碼完成子任務課程來緩解強化學習探索難題,對未執行的代碼段以細粒度優化;還開源了可用于強化學習訓練的APPS+數據集。大型語言模型(LLMs)的發展極大地推動了代碼生成領域的發展,之前有工作將強化學習(RL)與編譯器的反饋信號集成在一起,用于探索LLMs的輸出空間,以提高代碼生成質量。
        但當下還存在兩個問題:
        1. 強化學習探索很難直接適配到「復雜的人類需求」,即要求LLMs生成「長序列代碼」;
        2. 由于單元測試可能無法覆蓋復雜的代碼,因此使用未執行的代碼片段來優化LLMs是無效的。
        為了解決這些挑戰,復旦大學、華中科技大學、皇家理工學院的研究人員提出了一種用于代碼生成的新型強化學習框架StepCoder,由兩個主要組件組成:
        1. CCCS通過將長序列代碼生成任務分解為代碼完成子任務課程來解決探索挑戰;
        2. FGO通過屏蔽未執行的代碼段來優化模型,以提供細粒度優化。論文鏈接:https://arxiv.org/pdf/2402.01391.pdf
        項目鏈接:https://github.com/A


        原文鏈接:刷榜「代碼生成」任務!復旦等發布StepCoder框架:從編譯器反饋信號中強化學習

        聯系作者

        文章來源:新智元
        作者微信:AI_era
        作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲精品无码国产| 亚洲美女在线国产| 亚洲伊人久久大香线蕉影院| 中文字幕免费在线看电影大全| 免费a级毛片视频| 黄网站色视频免费观看45分钟| 国产精品高清全国免费观看| 国产成人高清亚洲一区91| 国产免费私拍一区二区三区| 特级aaaaaaaaa毛片免费视频| 国产在线19禁免费观看国产| 黄网站色成年片大免费高清| 亚洲国产午夜福利在线播放| 国产精品免费观看视频| 国产精品亚洲精品日韩已满| 99久久久国产精品免费蜜臀| 亚洲日本国产精华液| 天天看免费高清影视| 黄网站色视频免费看无下截| 亚洲色欲色欲www在线丝| 久久99热精品免费观看牛牛| 亚洲图片激情小说| 国产大片线上免费看| 久久免费观看视频| 亚洲美女大bbbbbbbbb| 成人性生交大片免费看无遮挡| 国产亚洲精品美女2020久久| 亚洲综合精品香蕉久久网| 8x成人永久免费视频| 亚洲成a人无码亚洲成av无码| 亚洲精品高清一二区久久| 免费精品99久久国产综合精品| 精品久久久久久亚洲精品| 免费观看亚洲人成网站| 在线毛片片免费观看| 亚洲中文字幕乱码一区| 亚洲中文字幕无码一久久区| 国产无人区码卡二卡三卡免费| 边摸边脱吃奶边高潮视频免费 | 久久久久久毛片免费播放| 亚洲精品无码永久在线观看男男|