AIGC動態歡迎閱讀
原標題:OpenAI凌晨發布新研究成果!證明者和驗證者無限套娃,大模型黑盒變可解釋又近一大步!
關鍵字:模型,解決方案,年齡,父親,問題
文章來源:人工智能學家
內容字數:0字
內容摘要:
夕小瑤科技說 原創作者 | 付奶茶
昨天凌晨,OpenAI發布了一項名為Prover-Verifier-Games(證明者-驗證者博弈)的新研究!
這項研究的目的是確保語言模型生成的文本易于理解,以提高它們在處理復雜任務(如解決數學問題)時的實用性。
OpenAI的研究人員認為,僅僅為了得到正確答案而優化強大模型的解題過程,可能會使生成的解決方案變得難以理解。而且在人類評估中,這樣高度優化的解決方案甚至錯誤率更高!因此在AI生成文本中,不僅要追求正確性,還要注重清晰度和易于驗證性。
研究人員嘗試用高級語言模型生成較弱模型容易驗證的文本,來提升輸出答案的可讀性和驗證性,為此OpenAI提出設計兩個角色:“證明者”生成解決方案,“驗證者”檢查其準確性。
接下來和奶茶一起來看下怎么個事!
提高可讀性研究人員的靈感來自于小學數學問題的思維鏈條,提出證明者VS驗證者的博弈理論框架,鼓勵模型以可驗證的方式解決決策問題。
研究人員舉了一個這樣的例子來模擬驗證、證明的博弈學習過程:Shawna的父親比她大五倍。Shawna目前比Aliya大三倍。如果Aliya三歲了,Shawna的父親多大?
1.模型
原文鏈接:OpenAI凌晨發布新研究成果!證明者和驗證者無限套娃,大模型黑盒變可解釋又近一大步!
聯系作者
文章來源:人工智能學家
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...