OpenAI Jason wei解讀o1:思維鏈的“頓悟時刻”,大模型不再鸚鵡學舌

AIGC動態(tài)歡迎閱讀
原標題:OpenAI Jason wei解讀o1:思維鏈的“頓悟時刻”,大模型不再鸚鵡學舌
關鍵字:報告,知識產(chǎn)權,人工智能,政策,華為
文章來源:人工智能學家
內(nèi)容字數(shù):0字
內(nèi)容摘要:
來源:AI寒武紀
OpenAI的研究員Jason Wei(o1思維鏈核心開發(fā)人員)點出了一個關鍵但容易被忽視的問題:思維鏈在o1出現(xiàn)前后發(fā)生了巨大的變化,雖然只是名稱上多了個”o1″,但這背后的含義卻遠不止如此
o1之前:模仿秀,不是真思考在o1范式出現(xiàn)之前(即思維鏈提示的早期階段),思維鏈的實際運作方式與我們期望的之間存在著很大的差異。我們希望思維鏈能夠反映模型真正的思考過程,但實際上,模型只是在模仿它在預訓練數(shù)據(jù)中看到的推理路徑,例如數(shù)學作業(yè)的解答。
這類數(shù)據(jù)的最大問題在于,它們是事后諸葛亮式的總結,作者在其他地方完成了所有思考過程后才寫下的答案,而不是真正的思維過程記錄。因此,這些答案的信息密度往往很低,一個極端的例子就是“答案是5,因為……”,其中“5”這個詞承載了幾乎所有的新信息量,而前面的鋪墊卻冗長而低效
o1之后:內(nèi)心獨白,信息量o1范式出現(xiàn)后,你會發(fā)現(xiàn)思維鏈看起來與教科書式的數(shù)學解答截然不同。這些思維鏈更像是模型的“內(nèi)心獨白”或“意識流”。你會看到模型進行回溯、修正,它會說“或者,讓我們試試……”、“等等,但是……”之類的話,體現(xiàn)了真正的思考和探索過程
Jason
原文鏈接:OpenAI Jason wei解讀o1:思維鏈的“頓悟時刻”,大模型不再鸚鵡學舌
聯(lián)系作者
文章來源:人工智能學家
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關文章
暫無評論...

粵公網(wǎng)安備 44011502001135號