AIGC動態歡迎閱讀
原標題:OpenAI超級對齊團隊再發「絕唱」!首提「證明者-驗證者」博弈,訓練GPT說人話
關鍵字:模型,可讀性,答案,年齡,人類
文章來源:新智元
內容字數:0字
內容摘要:
新智元報道編輯:喬楊 好困
【新智元導讀】當我們不停在CoT等領域大下苦功、試圖提升LLM推理準確性的同時,OpenAI的對齊團隊從另一個角度發現了華點——除了準確性,生成答案的清晰度、可讀性和可驗證性也同樣重要。不知道你有沒有過這樣的經歷:碰到一道做不出的數學題,于是丟給ChatGPT。
結果一通生成之后,ChatGPT的「不知所云」讓你從之前的略有頭緒瞬間變成完全迷茫。不管它是對是錯,反正人類是看不懂了。
提高LLM的數學和推理能力是最近研究關注的焦點,但同樣重要的是,確保模型生成可理解的文本。
否則即使答案正確,99%的人類都理解不了,也不能讓LLM真正協助我們處理復雜任務。
OpenAI近期發表的一篇論文就旨在研究并解決模型性能和可讀性(legibility)之間的平衡。
論文地址:https://openai.com/index/prover-verifier-games-improve-legibility/
和之前發出來的兩篇一樣,這次又是Jan Leike的庫存作品,但共同一作是兩位在職研究員Jan Hendrik Kirchner和Yining Chen。
估計超級
原文鏈接:OpenAI超級對齊團隊再發「絕唱」!首提「證明者-驗證者」博弈,訓練GPT說人話
聯系作者
文章來源:新智元
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...