拖了這么久,新模型再不發就有點不禮貌了。
原標題:OpenAI官宣o3系列王者模型:能解最難的數學題,單個任務最高花費數千美元,越貴越好用!
文章來源:AI前線
內容字數:9842字
OpenAI 最新發布 o3 和 o3-mini 大模型
在經過了為期12天的發布活動后,OpenAI終于推出了兩款新模型:o3和o3-mini。這兩款模型是o1和o1-mini的繼任者,旨在提高推理能力和編碼性能。OpenAI CEO Sam Altman在社交媒體上提前暗示了新模型的發布,并在直播中確認了這一消息。
o3 的優勢與性能
o3模型在編碼和推理方面表現出色,基準測試顯示其在多個任務中的表現均超過了前任o1。例如,o3在SWE-Bench Verified基準上比o1高出22.8個百分點,并在2024年美國數學邀請賽中獲得96.7%的高分。此外,o3的推理能力得到了顯著提升,能夠自我核實事實,減少錯誤風險。
安全性與對齊承諾
OpenAI在發布新模型時,更加注重安全性和對齊問題。Altman提到,他們正在采用新的“審議性對齊”技術,以確保o3模型能夠遵循安全原則,降低潛在風險。盡管o3的能力強大,但也存在一定的風險,因此需要持續監控和改進。
業內評價與AGI接近性
o3的發布引發了業內廣泛討論,部分專家認為其接近通用人工智能(AGI)。但也有觀點認為,盡管o3在特定任務上表現優異,它仍有不少局限性,無法完全定義為AGI。未來,OpenAI和其他公司可能會繼續開發推理模型,以探索更高效的AI解決方案。
推理模型的趨勢
隨著OpenAI發布o3,其他AI公司也紛紛推出推理模型,這標志著推理模型正成為行業發展的一大趨勢。盡管它們在基準測試中表現良好,但高昂的計算成本和可持續性仍是需要關注的問題。
總結
OpenAI的o3和o3-mini模型在推理能力和編碼性能上取得了顯著進步,顯示出其在人工智能領域的技術領導地位。同時,安全性和對齊問題的重視,表明了公司對模型潛在風險的關注。未來,推理模型的發展將繼續受到業內關注,成為AI研究的新方向。
聯系作者
文章來源:AI前線
作者微信:
作者簡介:面向AI愛好者、開發者和科學家,提供大模型最新資訊、AI技術分享干貨、一線業界實踐案例,助你全面擁抱AIGC。