虛假的OpenAI在被打假,真正的“OpenAI”在開源。
原標題:DeepSeek才是“真正的OpenAI”?|甲子光年
文章來源:甲子光年
內容字數:9099字
DeepSeek R1:開源的推理模型挑戰閉源OpenAI
本文報道了DeepSeek發布的開源推理模型DeepSeek R1,以及其與閉源OpenAI模型在性能和策略上的對比。DeepSeek R1憑借其開源、低價和強大的性能,引發了業界廣泛關注,被譽為“真正的OpenAI”。
1. DeepSeek R1:基于強化學習的突破
DeepSeek R1的核心亮點在于其“沒有監督微調下的直接強化學習”。團隊首先嘗試了DeepSeek-R1-Zero,直接用強化學習(RL)訓練基礎模型,無需監督微調數據。通過基于規則的獎勵系統,模型在推理能力上取得了顯著提升,甚至出現了“頓悟時刻”,展現了RL的強大潛力。然而,DeepSeek-R1-Zero也存在一些問題,如可讀性差。為此,DeepSeek團隊設計了一個四階段流程,最終打造出DeepSeek R1,在多個基準測試中達到甚至超過了OpenAI o1的性能。
2. 簡潔高效的訓練策略
DeepSeek R1的成功,也證明了“基于強大的模型,使用簡單的基于規則的獎勵進行強化學習,經過大量訓練,也能達到最強推理模型的效果”。團隊摒棄了復雜的過程獎勵模型,采用基于規則的獎勵系統,降低了訓練難度,并通過“數據即模型”的思路,利用DeepSeek-R1-Zero生成數據,優化DeepSeek R1的性能。這種簡潔高效的訓練方法,為其他研究者提供了新的思路。
3. 開源與低價:構建開放的AI生態
與OpenAI的閉源策略形成鮮明對比,DeepSeek R1及其相關模型均為開源,并采用了極具競爭力的低價策略,將每百萬token的成本降低了約95%。這不僅降低了AI應用的門檻,也為中小企業和個人開發者提供了更多機會,推動了AI技術的普及和發展。DeepSeek的開源策略體現了“美美與共”的精神,構建了一個更加開放和包容的AI生態。
4. 中國AI的崛起
DeepSeek R1的成功,以及其他中國AI廠商的快速發展,表明中國在AI領域正崛起成為一股不容忽視的力量。DeepSeek R1的開源和低價策略,不僅挑戰了OpenAI的市場地位,更重要的是,它為全球AI發展注入了新的活力,推動著人工智能向更開放、更普惠的方向發展。
總而言之,DeepSeek R1的出現,標志著AI技術發展進入了一個新的階段。其開源、低價和強大的性能,為AI技術的普及和應用提供了新的可能性,也為全球AI研究者提供了寶貴的經驗和參考。
聯系作者
文章來源:甲子光年
作者微信:
作者簡介:甲子光年是一家科技智庫,包含智庫、社群、企業服務版塊,立足中國科技創新前沿陣地,動態跟蹤頭部科技企業發展和傳統產業技術升級案例,推動人工智能、大數據、物聯網、云計算、新能源、新材料、信息安全、大健康等科技創新在產業中的應用與落地。