OpenAI o1智商120,還是被陶哲軒稱為「平庸的研究生」,但實(shí)力究竟如何?
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:OpenAI o1智商120,還是被陶哲軒稱為「平庸的研究生」,但實(shí)力究竟如何?
關(guān)鍵字:模型,智商,測試,研究者,研究生
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
機(jī)器之心報(bào)道
編輯:蛋醬、楊文o1消息滿天飛。自從 OpenAI 發(fā)布了新模型 o1 后,它就承包了 AI 領(lǐng)域近幾天的熱搜:
有人用門薩智商測試題「拷問」它,竟測得 o1 智商高達(dá) 120;
數(shù)學(xué)大佬陶哲軒要求 o1 回答一個(gè)措辭含糊的數(shù)學(xué)問題,最終得出一個(gè)結(jié)論:o1 是個(gè)平庸但不無能的研究生;
還有一位天體物理學(xué)論文作者,僅用 6 次 Prompt,就讓 o1 系列模型在 1 小時(shí)內(nèi),創(chuàng)建了代碼運(yùn)行版本,這可是他博士生期間 10 個(gè)月的工作量。
但在 ARC Prize 測試中,o1 的表現(xiàn)并沒有想象類拔萃,僅僅是追平幾個(gè)月前發(fā)布的 Claude 3.5 Sonnet。
看完五花八門的評測,大家反而有些迷茫了,o1 的實(shí)力到底怎么樣?
智商測試得分忽高忽低,網(wǎng)友紛紛質(zhì)疑
上周,OpenAI 在介紹 o1 時(shí)表示,它不需要專門訓(xùn)練,就能直接拿下數(shù)學(xué)奧賽金牌,甚至可以在博士級別的科學(xué)問答環(huán)節(jié)上超越人類專家。
這也讓大家對 o1 的「智力水平」產(chǎn)生了好奇。就在前天,X 博主 Maxim Lott 專門拿 o1 進(jìn)行了挪威門薩智商測試,結(jié)果測得它的智商高達(dá) 120,遠(yuǎn)遠(yuǎn)超過了其他所有的
原文鏈接:OpenAI o1智商120,還是被陶哲軒稱為「平庸的研究生」,但實(shí)力究竟如何?
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:
作者簡介: