OpenAI超級對齊團(tuán)隊再發(fā)「絕唱」!首提「證明者-驗證者」博弈,訓(xùn)練GPT說人話
AIGC動態(tài)歡迎閱讀
原標(biāo)題:OpenAI超級對齊團(tuán)隊再發(fā)「絕唱」!首提「證明者-驗證者」博弈,訓(xùn)練GPT說人話
關(guān)鍵字:模型,可讀性,答案,年齡,人類
文章來源:新智元
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
新智元報道編輯:喬楊 好困
【新智元導(dǎo)讀】當(dāng)我們不停在CoT等領(lǐng)域大下苦功、試圖提升LLM推理準(zhǔn)確性的同時,OpenAI的對齊團(tuán)隊從另一個角度發(fā)現(xiàn)了華點(diǎn)——除了準(zhǔn)確性,生成答案的清晰度、可讀性和可驗證性也同樣重要。不知道你有沒有過這樣的經(jīng)歷:碰到一道做不出的數(shù)學(xué)題,于是丟給ChatGPT。
結(jié)果一通生成之后,ChatGPT的「不知所云」讓你從之前的略有頭緒瞬間變成完全迷茫。不管它是對是錯,反正人類是看不懂了。
提高LLM的數(shù)學(xué)和推理能力是最近研究關(guān)注的焦點(diǎn),但同樣重要的是,確保模型生成可理解的文本。
否則即使答案正確,99%的人類都理解不了,也不能讓LLM真正協(xié)助我們處理復(fù)雜任務(wù)。
OpenAI近期發(fā)表的一篇論文就旨在研究并解決模型性能和可讀性(legibility)之間的平衡。
論文地址:https://openai.com/index/prover-verifier-games-improve-legibility/
和之前發(fā)出來的兩篇一樣,這次又是Jan Leike的庫存作品,但共同一作是兩位在職研究員Jan Hendrik Kirchner和Yining Chen。
估計超級
原文鏈接:OpenAI超級對齊團(tuán)隊再發(fā)「絕唱」!首提「證明者-驗證者」博弈,訓(xùn)練GPT說人話
聯(lián)系作者
文章來源:新智元
作者微信:
作者簡介: