<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        人大劉勇團隊「慢思考」機理分析:從雪球誤差到正確推理概率

        AIGC動態(tài)5個月前發(fā)布 機器之心
        353 0 0

        本文探討了外部慢思考在LLM推理中的作用機制,為理解外部慢思考方法提供了理論支撐,并為優(yōu)化LLM的推理能力提供了新思路。

        人大劉勇團隊「慢思考」機理分析:從雪球誤差到正確推理概率

        原標(biāo)題:人大劉勇團隊「慢思考」機理分析:從雪球誤差到正確推理概率
        文章來源:機器之心
        內(nèi)容字?jǐn)?shù):16843字

        大語言模型推理能力提升:從“慢思考”到理論框架

        本文探討了大語言模型(LLMs)推理能力提升的新方向——“慢思考”(Slow-Thinking)策略,特別是外部慢思考方法。文章基于論文“Rethinking External Slow-Thinking: From Snowball Errors to Probability of Correct Reasoning” (arxiv.org/abs/2501.15602),深入剖析了其理論基礎(chǔ)、機制以及對LLM推理能力的影響。

        1. LLM推理中的“雪球誤差”

        文章首先指出,LLMs在推理過程中存在“雪球誤差”效應(yīng)。類似于雪球越滾越大,LLMs的微小錯誤會在自回歸的推理過程中不斷累積放大,最終導(dǎo)致嚴(yán)重偏差。這種誤差累積源于LLM逐步執(zhí)行一系列原始任務(wù),前一步的錯誤會影響后續(xù)步驟,最終偏離正確答案。文章利用柏拉圖的“洞穴寓言”形象地解釋了這種現(xiàn)象:LLM的推理輸出只是其內(nèi)部推理過程的“影子”,受限于其從訓(xùn)練數(shù)據(jù)中學(xué)到的模式和誤差。

        2. 信息論視角下的推理錯誤概率

        為了量化雪球誤差,文章引入了互信息(MI)來衡量隱式推理序列與最終生成回復(fù)之間的共享信息量。信息損失被定義為互信息與隱式推理過程的信息熵之差,雪球誤差則為所有推理步驟上信息損失的累積。文章進一步建立了雪球誤差與推理錯誤概率之間的數(shù)系,證明了推理錯誤概率的下界隨推理步數(shù)線性增長,甚至可能指數(shù)級增長,解釋了LLM在長鏈推理任務(wù)中容易出錯的原因。實驗結(jié)果驗證了這一理論,在GSM8k數(shù)據(jù)集上,三款先進的LLM的互信息均隨推理路徑長度呈負(fù)指數(shù)級下降。

        3. 外部慢思考提升推理質(zhì)量的機理

        文章分析了外部慢思考方法提升LLM推理質(zhì)量的機理。外部慢思考方法主要通過寬度擴展(如BoN、CoT-SC、ToT、MCTS)和生成與選擇(從多個候選推理路徑中選擇最優(yōu)解)來提高生成正確答案的概率。文章利用信息論方法,推導(dǎo)出在雪球誤差存在時,獲得正確推理結(jié)果的概率公式,并以Beam Search為例,分析了寬度擴展與選擇可靠性之間的平衡關(guān)系,指出價值函數(shù)的可靠性至關(guān)重要。

        4. BoN與MCTS方法的對比

        文章對比了BoN和MCTS兩種外部慢思考方法。理論分析和實驗結(jié)果表明,在推理正確率相當(dāng)?shù)那闆r下,BoN的總推理成本與MCTS接近,甚至在某些情況下更低。實驗結(jié)果顯示,在GSM8k和PrOntoQA兩個數(shù)據(jù)集上,通過適當(dāng)調(diào)整參數(shù),BoN能夠達到甚至超越MCTS的推理效果。

        5. 結(jié)論

        文章總結(jié)指出,外部慢思考方法通過擴展推理空間來減少雪球誤差,但需要在正確性和計算開銷之間權(quán)衡。價值函數(shù)的可靠性和推理總成本是影響其有效性的關(guān)鍵因素。優(yōu)化獎勵函數(shù)和提升策略模型的推理能力是未來改進外部慢思考方法的關(guān)鍵方向。


        聯(lián)系作者

        文章來源:機器之心
        作者微信:
        作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 在线观看成人免费视频| 亚洲大尺码专区影院| 亚洲AV永久无码精品一福利 | 亚洲av一本岛在线播放| 0588影视手机免费看片| 亚洲国产精品自在线一区二区| 国产一级婬片A视频免费观看| 日本黄色免费观看| 色偷偷亚洲第一综合| 免费一级做a爰片性色毛片| 高h视频在线免费观看| 亚洲成av人片天堂网老年人| 午夜在线免费视频| 亚洲色偷偷综合亚洲AVYP| 你好老叔电影观看免费| 亚洲影院在线观看| 欧洲乱码伦视频免费| 亚洲精品无码久久久久秋霞| 午夜毛片不卡高清免费| 国产成人亚洲精品电影| 亚洲精品狼友在线播放| a级大片免费观看| 亚洲精品乱码久久久久久下载 | 国产无遮挡又黄又爽免费网站| 亚洲精品国精品久久99热一| 国产拍拍拍无码视频免费| 亚洲黄色免费网站| AV免费网址在线观看| 亚洲精品美女久久久久久久| 亚洲国产精品自在拍在线播放| 成在人线av无码免费高潮水| 久久亚洲精品AB无码播放| 好先生在线观看免费播放| 羞羞网站免费观看| 亚洲高清专区日韩精品| 永久免费AV无码国产网站| 免费一区二区三区在线视频| 亚洲妇熟XXXX妇色黄| 毛片免费观看网站| 国产一区二区三区免费观在线 | 日产久久强奸免费的看|