o3 mini版將在1月底推出,之后不久推出o3完整版。
原標題:OpenAI最強推理模型o3發布!AGI測試能力暴漲,最難數學測試分數碾壓同行
文章來源:智東西
內容字數:6462字
OpenAI發布o3模型:邁向通用人工智能的新階段
2023年12月21日,OpenAI在其“連續12日圣誕發布”活動中推出了重磅新品o3,標志著AI技術的又一重大進步。OpenAI CEO Sam Altman表示,o3在某些條件下接近通用人工智能(AGI),并強調其在復雜推理任務中的強大能力。
1. o3模型的特點
o3繼承了前代o1模型的思維鏈機制,能夠逐步解釋其邏輯推理過程,得出最準確的答案。新版本包括mini版和完整版,mini版將于2024年1月底推出。o3的推理時間可調節為低、中、高,推理效果隨時間提升而增強。
2. 性能測試與評估
在ARC-AGI測試中,o3在高推理能力設置下取得了87.5%的分數,顯著超過o1的成績。o3的能力在多個基準測試中表現優異,例如在SWE-Bench Verified中,準確率高達71.7%。此外,o3在編程競賽平臺Codeforces中得分達2727,展示出其卓越的編程能力。
3. 安全性與對齊策略
OpenAI還提出了“審議對齊”訓練方法,旨在提升模型的安全性。該方法通過明確的安全規范引導模型推理,避免了傳統訓練方法的局限性。研究顯示,o3在多個安全基準測試中表現優于其他競爭模型,顯示出其在安全性方面的優勢。
4. 未來展望
OpenAI計劃與ARC-AGI基金會合作,構建新的基準測試,進一步推動AI技術的發展。盡管o3系列模型的發布尚需時間,但其性能和潛力吸引了全球的關注,預示著通往AGI的競賽正在加速進行。
總之,o3模型的推出不僅是OpenAI技術進步的體現,更為未來的AI發展奠定了基礎,值得期待。
聯系作者
文章來源:智東西
作者微信:
作者簡介:智能產業新媒體!智東西專注報道人工智能主導的前沿技術發展,和技術應用帶來的千行百業產業升級。聚焦智能變革,服務產業升級。