思維鏈作者Jason Wei剖析LLM擴展范式：Just keep scaling！

原標題：思維鏈作者Jason Wei剖析LLM擴展范式：Just keep scaling！
文章來源：人工智能學家
內容字數：26492字

Jason Wei：大型語言模型的擴展范式與未來展望

本文總結了Jason Wei在賓夕法尼亞大學的客座講座，主題為大型語言模型的擴展范式。Jason Wei是思維鏈概念開山之作的第一作者，也是OpenAI的資深研究科學家，參與了ChatGPT的構建等重要項目。他的演講深入探討了LLM發展歷程中的擴展策略，并對未來發展方向進行了展望。

1. 擴展的定義與重要性

傳統上，擴展指增加模型規模、數據量和GPU數量來提升AI能力。Wei給出了更精確的定義：擴展是將自身置于可沿連續軸移動并預期持續改進的環境中。盡管擴展面臨技術和心理挑戰（如高昂的計算成本、對算法改進的偏好等），但它是AI進步的關鍵引擎，并將繼續主導該領域的發展。

2. 擴展范式一：下一詞預測 (2018年至今)

下一詞預測是一個大規模多任務學習過程。通過預測下一詞，模型學法、世界知識、情感分析、翻譯等多種能力。模型的整體準確率是多個子任務性能的加權和，這解釋了“涌現”現象：某些能力在模型規模達到一定閾值后才出現顯著提升。雖然下一詞預測可能最終實現AGI，但過程將極其困難，需要持續大規模擴展。

3. 擴展范式二：基于思維鏈擴展強化學習

純粹的下一詞預測在處理復雜任務時存在局限性。思維鏈 (CoT) 提示模型像人類一樣展示推理過程，OpenAI通過強化學習優化了模型的思維鏈能力，使其更好地解決復雜問題。 o1項目就是一個成功的案例，它能夠在解決復雜問題（如化學題、競賽數學題）時，展示詳細的推理步驟，顯著提升了解題能力。

4. AI 文化的變革

擴展改變了AI研究文化：研究重點從改進算法轉向改進數據質量；基準測試被“飽和”的速度加快；研究轉向高度多任務模型；智能和用戶體驗成為可以分別改進的維度；需要更大規模的團隊合作。

5. 未來展望

Wei對AI的未來發展充滿信心，他認為未來五年AI將取得比過去五年更大的進步。主要發展方向包括：AI在科學和醫療健康領域的應用；提高事實準確性，減少虛假信息；發展多模態AI能力；增強工具使用能力；擴大AI應用范圍。他總結道：“just keep scaling”（繼續擴展）是推動AI持續進步的關鍵策略。

總而言之，Jason Wei的演講強調了擴展在推動大型語言模型發展中的核心作用，并指出了未來研究和應用的重點方向。持續的擴展，以及對數據質量和用戶體驗的重視，將是未來AI進步的關鍵。