原標題:謝謝Deepseek,o3-mini發布即免費!編程斷崖式領先,思考過程冰冷而客觀
文章來源:夕小瑤科技說
內容字數:5679字
OpenAI o3-mini震撼發布:免費、高效、強大的推理模型
今日凌晨,OpenAI正式上線了其最新的推理模型o3-mini,并將其集成到ChatGPT中,最令人驚喜的是,免費用戶也能直接使用!只需在消息編輯器中選擇“Reason”即可調用。這標志著ChatGPT首次向免費用戶提供推理模型能力,引發了廣泛關注。
1. o3-mini 的主要特性
o3-mini 在速度、性能和價格方面均實現了顯著提升,相比前代o1-mini:
- 速度更快:延遲更低,響應速度提升24%,平均響應時間縮短至7.7秒。
- 性能更強:答案更準確,幻覺更少,推理能力大幅增強,尤其在編程方面表現突出。
- 價格更低:成本降低了93%。
針對不同用戶,OpenAI 提供了不同的訪問權限和API版本選擇,滿足多樣化的需求。Plus和Team用戶每天限制150次對話,Pro用戶可無限制訪問,Enterprise用戶將于2月推出。API則向3-5級開發者開放,提供low、medium、high三種版本,開發者可根據實際情況靈活選擇。
2. 與DeepSeek R1的對比引爆熱議
不同于以往新模型發布時主要與OpenAI自家模型或Claude、Gemini進行比較,這次o3-mini的出現,卻意外地引發了與DeepSeek R1的大規模橫向對比。國友從性價比、思維鏈、編程能力等多個維度進行了深入探討。雖然o3-mini在許多方面表現更好,但DeepSeek R1在某些特定場景下也展現了其優勢,例如在模擬多球碰撞的物理效果方面。
3. 編程能力的顯著提升
o3-mini在編程能力上的提升最為顯著,許多網友分享了其在編寫復雜Python程序方面的驚艷表現。例如,僅用8秒就編寫了一個包含注冊/登錄、發推、點贊、轉推等功能的簡易Twitter網站克隆版。這在以往需要熟練程序員花費數小時甚至一天才能完成。
4. Agent 應用開發的潛在突破
o3-mini的低成本和高效率,使其成為Agent應用開發的理想選擇。開發者可以利用o3-mini替代成本高昂的o1,從而降低開發成本,并提升Agent的思考和執行效率。這或許將加速Agent應用的普及和發展。
5. 安全評估與未來展望
OpenAI同時發布了o3-mini的安全評估報告,顯示其幻覺現象減少,安全性有所提升。但報告也指出,針對System message字段的攻擊,o3-mini的表現反而略遜于o1。未來,如何在技術進步與安全責任之間取得平衡,將是OpenAI乃至整個AI行業需要持續關注和解決的關鍵問題。o3-mini的出現,無疑為AI技術的發展指明了方向,即讓智能成為人人觸及的力量。
聯系作者
文章來源:夕小瑤科技說
作者微信:
作者簡介:低負擔解碼AI世界,硬核也可愛!聚集35萬AI發燒友、開發者和從業者,廣泛覆蓋互聯網大廠中高管、AI公司創始人和機構投資人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備敏銳的行業嗅覺和洞察深度。商務合作:zym5189