思維鏈？思維樹？華為諾亞：現在到了思維森林時刻！

思維森林為 LLM 的推理能力提升提供了一條新的路徑。

原標題：思維鏈？思維樹？華為諾亞：現在到了思維森林時刻！
文章來源：機器之心
內容字數：4710字

華為諾亞方舟實驗室提出新型大模型高階推理框架：思維森林 (FoT)

近年來，大語言模型(LLM)在諸多語言任務中表現出色，但在復雜推理方面卻常常力不從心。OpenAI 的 o1 和 o3 模型的發布，預示著大模型高階推理能力的爆發式增強，同時也凸顯了探索新型Scaling Law的必要性。華為諾亞方舟實驗室近期提出的“思維森林”（Forest-of-Thought，FoT）框架，為解決LLM推理困境提供了一種新思路。

1. LLM推理困境

LLM在解決復雜推理問題時，容易忽略關鍵細節或在中間步驟出錯，最終導致答案錯誤。此外，LLM通常缺乏重新評估能力，無法全面應對復雜問題，這與人類反復思考、驗證答案的思維方式形成鮮明對比。

2. 思維森林(FoT)方法介紹

FoT框架通過整合多個推理樹，利用集體決策的優勢來解決復雜邏輯推理任務。其核心思想在于：

稀疏激活策略： FoT不會計算所有推理樹和節點，而是選擇最相關的進行計算，提高效率和準確性。
動態自校正策略： FoT評估每個推理步驟的正確性和有效性，并根據預設閾值觸發校正機制。該機制從過去的錯誤中學習，實時糾正錯誤，避免重復犯錯。
引導決策策略： 每個推理樹生成一個或多個答案，子樹進行投票，選出獲得最多支持的答案。若無，則由“數學專家”評估并選擇最終答案。

這些策略共同作用，使得FoT能夠有效提升LLM的高階推理能力。

3. 實驗結果

研究人員在24點游戲、GSM8K和MATH數據集上對FoT進行了評估，結果表明：

24點游戲： 增加推理樹數量能顯著提升準確率，多樹策略優于單樹增加復雜度策略。
GSM8K： 不同基模型(Llama3-8B,Mistral-7B,GLM-4-9B)下，樹數量越多，準確率提升越顯著。
MATH： FoT在不同難度級別的問題上均展現出一致的性能提升，優于MCTSr方法。

4. FoT的廣泛應用前景

FoT框架在數學、邏輯、金融、醫療和法律等需要復雜推理的領域具有廣泛的應用前景，例如風險評估、投資決策、疾病診斷、法律推理等。它可以與現有LLM結合，提升其在各個領域的應用效果。

5. 結語

思維森林(FoT)框架為LLM推理能力提升提供了一條新路徑。它通過多路徑探索和動態激活推理路徑，有效解決了現有LLM推理范式中的關鍵局限，推動大模型向更智能、更高效的方向發展。

聯系作者

文章來源：機器之心
作者微信：
作者簡介：專業的人工智能媒體和產業服務平臺

閱讀原文

# AIGC動態 # 人工智能涌現能力 # 大型語言模型森林 # 思維樹模型 # 思維鏈推理 # 諾亞方舟實驗室AI

文章版權歸作者所有，未經允許請勿轉載。

暫無評論

暫無評論...

思維鏈？思維樹？華為諾亞：現在到了思維森林時刻！

思維森林為 LLM 的推理能力提升提供了一條新的路徑。

華為諾亞方舟實驗室提出新型大模型高階推理框架：思維森林 (FoT)

1. LLM推理困境

2. 思維森林(FoT)方法介紹

3. 實驗結果

4. FoT的廣泛應用前景

5. 結語

聯系作者

微軟華人團隊最新研究：從LLM到LAM，讓大模型真正具有「行動力」！

神經網絡中的知識提取-辛頓教授2015的論文

相關文章

暫無評論

ChatGPT

玩虛擬模特？