Verifier Engineering：創新后訓練范式推動產品智能化與個性化升級

Verifier Engineering是一種新穎的后訓練范式，由中國科學院、阿里巴巴和小紅書聯合推出，旨在為基礎模型設計提供有效的監督信號。該技術通過自動化驗證器執行驗證任務，并向基礎模型反饋信息，分為搜索、驗證和反饋三個階段，從而顯著優化模型性能。基于閉環反饋機制，Verifier Engineering強化了模型的泛化能力，為實現人工通用智能邁出了重要一步。

Verifier Engineering是什么

Verifier Engineering（驗證器工程）是一種創新的后訓練策略，專為基礎模型設計，旨在解決有效監督信號的提供問題。通過自動化驗證器執行驗證任務并反饋信息，該方法分為搜索、驗證和反饋三個階段，以優化模型的性能。借助閉環反饋機制，Verifier Engineering不僅提升了模型的準確性，還增強了其泛化能力，是實現人工通用智能的關鍵步驟。

Verifier Engineering的主要功能

搜索（Search）：根據指定指令，從模型輸出中采樣具有代表性或潛在問題的樣本。
驗證（Verify）：利用多種驗證器（如規則檢測、評估指標或人工注釋）評估生成的候選響應。
反饋（Feedback）：基于驗證結果，采用監督式微調或上下文學習等方法提升模型性能。
持續優化模型性能：通過閉環反饋機制，不斷提高模型的準確性和可靠性。

Verifier Engineering的技術原理

目標條件馬爾可夫決策過程（GC-MDP）：將驗證器工程形式化為GC-MDP，涵蓋狀態空間、動作空間、轉移函數、目標空間、目標分布和獎勵函數。
搜索結構：實施線性搜索和樹搜索，在狀態-動作空間內導航，以平衡探索與利用。
驗證器分類：依據驗證形式（如二進制、分數、排名、文本反饋）、驗證粒度（標記級、思想級、軌跡級）、驗證器來源（基于程序或模型）以及是否需額外訓練對驗證器進行分類。
反饋方法：
- 基于訓練的反饋：通過高效的數據更新模型參數。
- 基于推理的反饋：在推理過程中調整輸入或策略，而不更改模型參數。