「think step by step」還不夠，讓模型「think more steps」更有用

AIGC動態2年前 (2024)發布機器之心

AIGC動態歡迎閱讀

原標題：「think step by step」還不夠，讓模型「think more steps」更有用
關鍵字：研究者,步驟,問題,模型,樣本
文章來源：機器之心
內容字數：8828字

內容摘要：

機器之心報道
機器之心編輯部本文對思維鏈的推理步長進行了控制變量實驗，發現推理步長和答案的準確性是線性相關的，這種影響機制甚至超越了問題本身所產生的差異。如今，大型語言模型（LLM）及其高級提示策略的出現，標志著對語言模型的研究取得了重大進展，尤其是在經典的 NLP 任務中。這其中一個關鍵的創新是思維鏈（CoT）提示技術，該技術因其在多步驟問題解決中的能力而聞名。這項技術遵循了人類的順序推理，在各種挑戰中表現出了優秀的性能，其中包括跨域、長泛化和跨語言的任務。CoT 及其富有邏輯的、循序漸進的推理方法，在復雜的問題解決場景中提供了至關重要的可解釋性。
盡管 CoT 取得了長足的進展，但研究界尚未就 CoT 及其變體的具體機制和有效原因達成。這種知識差距意味著提高 CoT 性能仍是一個探索領域。而這種探索主要依賴于試錯，因為目前還缺乏改進 CoT 效果的系統性方，研究人員只能依賴猜測和實驗。但是這也同時表明該領域存在著重要的研究機遇：對 CoT 的內部運作形成更深入、更結構化的理解。如果實現這個目標，不僅能揭開當前 CoT 過程的神秘面紗，還能為在各種復雜的 NLP 任務中更可靠

原文鏈接：「think step by step」還不夠，讓模型「think more steps」更有用