OpenAI凌晨發布新研究成果！證明者和驗證者無限套娃，大模型黑盒變可解釋又近一大步！

AIGC動態1年前 (2024)發布人工智能學家

AIGC動態歡迎閱讀

原標題：OpenAI凌晨發布新研究成果！證明者和驗證者無限套娃，大模型黑盒變可解釋又近一大步！
關鍵字：模型,解決方案,年齡,父親,問題
文章來源：人工智能學家
內容字數：0字

內容摘要：

夕小瑤科技說原創作者 | 付奶茶
昨天凌晨，OpenAI發布了一項名為Prover-Verifier-Games（證明者-驗證者博弈）的新研究！
這項研究的目的是確保語言模型生成的文本易于理解，以提高它們在處理復雜任務（如解決數學問題）時的實用性。
OpenAI的研究人員認為，僅僅為了得到正確答案而優化強大模型的解題過程，可能會使生成的解決方案變得難以理解。而且在人類評估中，這樣高度優化的解決方案甚至錯誤率更高！因此在AI生成文本中，不僅要追求正確性，還要注重清晰度和易于驗證性。
研究人員嘗試用高級語言模型生成較弱模型容易驗證的文本，來提升輸出答案的可讀性和驗證性，為此OpenAI提出設計兩個角色：“證明者”生成解決方案，“驗證者”檢查其準確性。
接下來和奶茶一起來看下怎么個事！
提高可讀性研究人員的靈感來自于小學數學問題的思維鏈條，提出證明者VS驗證者的博弈理論框架，鼓勵模型以可驗證的方式解決決策問題。
研究人員舉了一個這樣的例子來模擬驗證、證明的博弈學習過程：Shawna的父親比她大五倍。Shawna目前比Aliya大三倍。如果Aliya三歲了，Shawna的父親多大？
1.模型

原文鏈接：OpenAI凌晨發布新研究成果！證明者和驗證者無限套娃，大模型黑盒變可解釋又近一大步！