網友:可能是理解現實物理的最佳LLM
原標題:首個OpenAI免費推理模型o3-mini發布!DeepSeek讓奧特曼反思:不開源我們錯了
文章來源:量子位
內容字數:4325字
OpenAI緊急發布o3-mini推理模型,直面DeepSeek挑戰
近日,OpenAI深夜緊急發布了全新推理模型o3-mini系列,包含low、medium和high三個版本,旨在推動低成本推理。此舉被認為是對近期開源模型DeepSeek的回應。
1. o3-mini系列模型:更快、更準、更強
o3-mini系列延續了mini系列“小而美”的風格,針對STEM領域進行優化。與前代o1-mini相比,o3-mini在數學編碼、科學推理和代碼生成方面均有顯著提升,響應速度也更快,平均響應時間縮短了24%。在FrontierMath難題測試中,高推理強度下的o3-mini表現大幅超越o1系列。官方數據顯示,搭配Python工具使用,o3-mini (high)在第一次嘗試時就解決了超過32%的問題,其中包括28%以上的T3級難題。
2. 免費開放與CEO奧特曼的反思
值得注意的是,這是OpenAI首次向用戶免費推出推理模型,ChatGPT Plus、團隊和Pro用戶可立即訪問,企業級訪問將在一周后開放。免費用戶可通過“Search+Reason”功能體驗。在Reddit問答活動中,CEO奧特曼罕見地公開反思,承認OpenAI在開源權重AI模型問題上“站在了歷史錯誤的一邊”,并承認OpenAI的領先優勢將縮小。
3. 網友實測:褒貶不一,DeepSeek仍具性價比優勢
網友們對o3-mini的測試結果褒貶不一。部分測試顯示o3-mini在某些復雜任務上優于DeepSeek-R1,但在一些場景下,DeepSeek-R1憑借其更低的價格和更快的速度,仍然保持著性價比優勢。許多網友認為DeepSeek-R1是目前性價比之王。
4. OpenAI未來計劃:GPT-5、更多工具支持
奧特曼在Reddit問答中透露了OpenAI的一些未來計劃,包括即將更新的高級語音模式(直接命名為GPT-5,而非GPT-5o)以及推理模型支持更多工具等。滿血版o3模型也被提及,但距離發布尚遠。
5. DeepSeek的沖擊與行業格局變化
DeepSeek的出現對OpenAI造成了顯著沖擊,迫使OpenAI加快了o3-mini的發布進程,并促使CEO公開反思公司策略。這標志著AI行業格局正在發生變化,開源模型的崛起正在挑戰傳統巨頭的領先地位。
總而言之,o3-mini的發布是OpenAI對競爭壓力做出的回應,雖然在性能上有所提升,但DeepSeek帶來的沖擊和開源模型的崛起,正在重塑AI行業的競爭格局。
聯系作者
文章來源:量子位
作者微信:
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破