o1突發(fā)曝光?谷歌8月論文已揭示原理,大模型光有軟件不存在護城河
AIGC動態(tài)歡迎閱讀
原標題:o1突發(fā)曝光?谷歌8月論文已揭示原理,大模型光有軟件不存在護城河
關鍵字:模型,護城河,策略,測試,效果
文章來源:量子位
內容字數(shù):0字
內容摘要:
明敏 發(fā)自 凹非寺量子位 | 公眾號 QbitAI發(fā)布不到1周,OpenAI最強模型o1的護城河已經沒有了。
有人發(fā)現(xiàn),谷歌DeepMind一篇發(fā)表在8月的論文,揭示原理和o1的工作方式幾乎一致。
這項研究表明,增加測試時(test-time)計算比擴展模型參數(shù)更有效。
基于論文提出的計算最優(yōu)(compute-optimal)測試時計算擴展策略,規(guī)模較小的基礎模型在一些任務上可以超越一個14倍大的模型。
網友表示:
這幾乎就是o1的原理啊。
眾所周知,奧特曼喜歡領先于谷歌,所以這才是o1搶先發(fā)preview版的原因?
有人由此感慨:
確實正如谷歌自己所說的,沒有人護城河,也永遠不會有人有護城河。
就在剛剛,OpenAI將o1-mini的速度提高7倍,每天都能使用50條;o1-preview則提到每周50條。
計算量節(jié)省4倍谷歌DeepMind這篇論文的題目是:優(yōu)化LLM測試時計算比擴大模型參數(shù)規(guī)模更高效。
研究團隊從人類的思考模式延伸,既然人面對復雜問題時會用更長時間思考改善決策,那么LLM是不是也能如此?
換言之,面對一個復雜任務時,是否能讓LLM更有效利用測試時的額外計算以提高準確
原文鏈接:o1突發(fā)曝光?谷歌8月論文已揭示原理,大模型光有軟件不存在護城河
聯(lián)系作者
文章來源:量子位
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...