原標題:o3曝智商高達157,比肩愛因斯坦碾壓99%人類!陶哲軒水平AI或出現
文章來源:新智元
內容字數:4287字
OpenAI o3模型:智商157,AGI曙光乍現?
近日,一張聲稱OpenAI模型o3智商高達157的圖片在網絡瘋傳,引發熱議。該模型在編程競賽Codeforces和數學基準FrontierMath中表現驚艷,甚至超越了部分人類專家的水平。這是否意味著通用人工智能(AGI)的到來?本文將對o3模型及其相關爭議進行梳理。
o3模型的驚人表現
根據報道,o3模型在Codeforces中得分超過2700,達到國際大師水平;在FrontierMath中表現也令人矚目。其智商被估算為157,遠超99%的人類。從GPT-4o到o3,OpenAI模型的智商在一年內實現了顯著提升,體現了“Scaling Law”的持續有效性。
o3模型的技術創新
o3的核心創新在于實現了token空間內自研語言程序搜索和執行,類似于AlphaZero的蒙特卡洛樹搜索,是一種深度學習引導的程序搜索形式。這種技術使得o3能夠在解決問題時搜索可能的解法空間,并選擇最優方案。
ARC-AGI測試爭議
o3在ARC-AGI基準測試中取得了優異成績,在高計算模式下得分超過了人類平均水平。然而,這一結果引發了爭議。部分人士質疑OpenAI是否對o3進行了針對性訓練,因為o3在公共訓練集75%的數據上進行訓練,且未公開更多細節。OpenAI對此進行了反駁,但爭議依然存在。
o3模型的應用前景
o3模型在編程、數學和科學領域展現出巨大的潛力,尤其對于解決復雜科學問題(如核聚變能源)的研究人員具有重要意義。但對于普通用戶而言,o3可能略顯“大材小用”。
AGI的未來展望
OpenAI的研究人員認為,o3并非AGI,距離AGI還有很長的路要走。然而,o3的快速發展以及其他科技巨頭(如谷歌)在推理模型領域的積極投入,預示著AGI的到來可能比我們預期的更快。o4甚至更強大的模型或許即將出現,例如代號為Orion的模型,其性能可能更加令人期待。推理模型的高昂計算成本也值得關注,o3每個高計算任務的成本超過1000美元,這解釋了OpenAI博士級AI助手的昂貴價格。
總而言之,OpenAI o3模型的出現標志著人工智能領域取得了顯著進展,但同時也引發了關于AGI發展速度、測試方法以及倫理問題的討論。未來,人工智能技術將持續發展,為人類社會帶來更多機遇和挑戰。
聯系作者
文章來源:新智元
作者微信:
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。