<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        o3并非獨門秘技,谷歌已發背后關鍵機制,方法更簡單、成本更低

        AIGC動態9個月前發布 量子位
        238 0 0

        編碼任務性能最多提高40%。

        o3并非獨門秘技,谷歌已發背后關鍵機制,方法更簡單、成本更低

        原標題:o3并非獨門秘技,谷歌已發背后關鍵機制,方法更簡單、成本更低
        文章來源:量子位
        內容字數:3798字

        谷歌DeepMind等團隊研究:重復采樣提升大模型推理能力

        本文總結了斯坦福、牛津大學和谷歌DeepMind團隊合作發表的一篇論文,該論文探討了通過重復采樣來擴展大模型推理計算量的方法,并取得了顯著成果。論文名為“Monkey”,靈感源于無限猴子定理,其核心思想是:通過多次采樣生成多種候選答案,然后利用驗證器選擇最佳答案,從而提升模型性能。

        1. 重復采樣方法

        該方法的核心步驟包括:首先,利用大模型為給定問題生成多個候選解;其次,使用特定領域的驗證器(例如代碼的單元測試)從生成的樣本中篩選出最終答案。該方法的有效性取決于兩個關鍵因素:覆蓋率(隨著樣本數量增加,能夠解決的問題比例)和精確度(從樣本中識別正確答案的能力)。論文主要關注的是可以簡單判斷對錯的yes/no型任務,以成功率(解決問題的比例)作為主要指標。

        2. 實驗結果與分析

        研究團隊在五個數學和編程任務(GSM8K、MATH、MiniF2F-MATH、CodeContests、SWE-benchLite)上進行了實驗。結果表明:

        1. 覆蓋率隨著樣本數量的增加而顯著提升,在某些情況下,使用重復采樣的較弱模型甚至超越了單次嘗試性能更好的強大模型。
        2. 重復采樣具有成本效益。例如,使用Gemma-2B解決CodeContests編程問題時,覆蓋率提高了300倍以上。在固定FLOPs預算下,較小的Llama-3-8B-Instruct模型在某些任務上的覆蓋率高于更大的Llama-3-70B-Instruct模型。
        3. 開源模型DeepSeek-Coder-V2-Instruct在采樣較多時,其問題解決率可以達到與閉源模型GPT-4o相同的水平,但成本僅為后者的三分之一。
        4. 覆蓋率與樣本數之間通常遵循近似的冪律關系,在Llama-3和Gemma模型中表現為近似對數線性增長。
        5. 不同參數量、不同模型以及不同訓練水平下,重復采樣都能有效提升覆蓋率。

        3. 與其他方法的比較

        有網友將該方法與o3方法進行比較。o3通過回溯動態搜索程序空間,而重復采樣則依賴于靜態采樣和事后評價。兩者都能擴展推理計算,但o3適應性更強,計算密集度更高,在需要結構化推理的任務中表現出色;而重復采樣在編碼/數學方面更具成本效益。

        4. 局限性

        需要注意的是,增加采樣數量并非無限提升性能的良方。在某個臨界點之后,模型性能會趨于停滯,生成的樣本也會開始重復。因此,存在一個模型無法超越的最大思維水平。

        5. 總結

        這篇論文提出了一種基于重復采樣的推理計算擴展方法,通過多次采樣和驗證器篩選,顯著提升了大模型的推理能力和成本效益。該方法在多種模型和任務上都取得了成功,但同時也存在一定的局限性。未來研究可以進一步探索如何優化采樣策略,以及如何更好地處理樣本重復和性能瓶頸問題。


        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产精品酒店视频免费看| 久久乐国产精品亚洲综合| 水蜜桃视频在线观看免费| 久久精品国产亚洲网站| 亚洲免费闲人蜜桃| 久久亚洲精品高潮综合色a片| 久久精品国产亚洲7777| 18禁止看的免费污网站| 噜噜噜亚洲色成人网站| 国产亚洲AV无码AV男人的天堂| 69xx免费观看视频| 又硬又粗又长又爽免费看| 亚洲一区二区三区电影| 国产公开免费人成视频| 99在线免费观看视频| 国产成人久久精品亚洲小说| 久久亚洲精品中文字幕| 免费中文字幕一级毛片| **实干一级毛片aa免费| 久久毛片免费看一区二区三区| 中文字幕无线码免费人妻| 亚洲国产午夜电影在线入口| 亚洲伊人久久综合影院| 午夜宅男在线永久免费观看网| 亚洲欧洲国产精品久久| 久久久青草青青国产亚洲免观 | 国产一区二区三区在线免费观看 | 黄色三级三级免费看| 亚洲免费视频播放| 亚洲国产精品久久久天堂| 国产精品国产午夜免费福利看| 日本一卡精品视频免费| 国产美女视频免费观看的网站| 亚洲精华国产精华精华液| 91天堂素人精品系列全集亚洲 | 麻豆狠色伊人亚洲综合网站| 亚洲AV本道一区二区三区四区 | 亚洲人成网站免费播放| 亚洲白嫩在线观看| 日韩va亚洲va欧洲va国产| 亚洲va中文字幕无码|