首個OpenAI免費推理模型o3-mini發(fā)布!DeepSeek讓奧特曼反思:不開源我們錯了
網(wǎng)友:可能是理解現(xiàn)實物理的最佳LLM
原標題:首個OpenAI免費推理模型o3-mini發(fā)布!DeepSeek讓奧特曼反思:不開源我們錯了
文章來源:量子位
內(nèi)容字數(shù):4325字
OpenAI緊急發(fā)布o3-mini推理模型,直面DeepSeek挑戰(zhàn)
近日,OpenAI深夜緊急發(fā)布了全新推理模型o3-mini系列,包含low、medium和high三個版本,旨在推動低成本推理。此舉被認為是對近期開源模型DeepSeek的回應。
1. o3-mini系列模型:更快、更準、更強
o3-mini系列延續(xù)了mini系列“小而美”的風格,針對STEM領(lǐng)域進行優(yōu)化。與前代o1-mini相比,o3-mini在數(shù)學編碼、科學推理和代碼生成方面均有顯著提升,響應速度也更快,平均響應時間縮短了24%。在FrontierMath難題測試中,高推理強度下的o3-mini表現(xiàn)大幅超越o1系列。官方數(shù)據(jù)顯示,搭配Python工具使用,o3-mini (high)在第一次嘗試時就解決了超過32%的問題,其中包括28%以上的T3級難題。
2. 免費開放與CEO奧特曼的反思
值得注意的是,這是OpenAI首次向用戶免費推出推理模型,ChatGPT Plus、團隊和Pro用戶可立即訪問,企業(yè)級訪問將在一周后開放。免費用戶可通過“Search+Reason”功能體驗。在Reddit問答活動中,CEO奧特曼罕見地公開反思,承認OpenAI在開源權(quán)重AI模型問題上“站在了歷史錯誤的一邊”,并承認OpenAI的領(lǐng)先優(yōu)勢將縮小。
3. 網(wǎng)友實測:褒貶不一,DeepSeek仍具性價比優(yōu)勢
網(wǎng)友們對o3-mini的測試結(jié)果褒貶不一。部分測試顯示o3-mini在某些復雜任務上優(yōu)于DeepSeek-R1,但在一些場景下,DeepSeek-R1憑借其更低的價格和更快的速度,仍然保持著性價比優(yōu)勢。許多網(wǎng)友認為DeepSeek-R1是目前性價比之王。
4. OpenAI未來計劃:GPT-5、更多工具支持
奧特曼在Reddit問答中透露了OpenAI的一些未來計劃,包括即將更新的高級語音模式(直接命名為GPT-5,而非GPT-5o)以及推理模型支持更多工具等。滿血版o3模型也被提及,但距離發(fā)布尚遠。
5. DeepSeek的沖擊與行業(yè)格局變化
DeepSeek的出現(xiàn)對OpenAI造成了顯著沖擊,迫使OpenAI加快了o3-mini的發(fā)布進程,并促使CEO公開反思公司策略。這標志著AI行業(yè)格局正在發(fā)生變化,開源模型的崛起正在挑戰(zhàn)傳統(tǒng)巨頭的領(lǐng)先地位。
總而言之,o3-mini的發(fā)布是OpenAI對競爭壓力做出的回應,雖然在性能上有所提升,但DeepSeek帶來的沖擊和開源模型的崛起,正在重塑AI行業(yè)的競爭格局。
聯(lián)系作者
文章來源:量子位
作者微信:
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破