OpenAI o1智商120，還是被陶哲軒稱為「平庸的研究生」，但實力究竟如何？

AIGC動態1年前 (2024)發布機器之心

AIGC動態歡迎閱讀

原標題：OpenAI o1智商120，還是被陶哲軒稱為「平庸的研究生」，但實力究竟如何？
關鍵字：模型,智商,測試,研究者,研究生
文章來源：機器之心
內容字數：0字

內容摘要：

機器之心報道
編輯：蛋醬、楊文o1消息滿天飛。自從 OpenAI 發布了新模型 o1 后，它就承包了 AI 領域近幾天的熱搜：
有人用門薩智商測試題「拷問」它，竟測得 o1 智商高達 120；
數學大佬陶哲軒要求 o1 回答一個措辭含糊的數學問題，最終得出一個結論：o1 是個平庸但不無能的研究生；
還有一位天體物理學論文作者，僅用 6 次 Prompt，就讓 o1 系列模型在 1 小時內，創建了代碼運行版本，這可是他博士生期間 10 個月的工作量。
但在 ARC Prize 測試中，o1 的表現并沒有想象類拔萃，僅僅是追平幾個月前發布的 Claude 3.5 Sonnet。
看完五花八門的評測，大家反而有些迷茫了，o1 的實力到底怎么樣？
智商測試得分忽高忽低，網友紛紛質疑
上周，OpenAI 在介紹 o1 時表示，它不需要專門訓練，就能直接拿下數學奧賽金牌，甚至可以在博士級別的科學問答環節上超越人類專家。
這也讓大家對 o1 的「智力水平」產生了好奇。就在前天，X 博主 Maxim Lott 專門拿 o1 進行了挪威門薩智商測試，結果測得它的智商高達 120，遠遠超過了其他所有的

原文鏈接：OpenAI o1智商120，還是被陶哲軒稱為「平庸的研究生」，但實力究竟如何？