原標題:Anthropic創始人:DeepSeek只是以低成本生產出了美國7-10月前模型水平的產品,并不是獨特突破!
文章來源:AI范兒
內容字數:13907字
DeepSeek深度解讀:并非顛覆,而是AI發展進程中的一個節點
近日,中國AI初創公司DeepSeek發布的語言模型DeepSeek-R1引發軒然,其聲稱以遠低于常規成本達到了美國頂級AI系統的性能水平。這一消息導致Nvidia市值大幅蒸發,并引發了關于AI未來發展的激烈討論。然而,Anthropic聯合創始人Dario Amodei對DeepSeek的成就進行了深入分析,其觀點重塑了我們對DeepSeek公告的理解。
1. “600萬美元模型”的誤讀
Amodei指出,“600萬美元模型”的說法忽略了關鍵背景。他以Anthropic的Claude 3.5 Sonnet為例,指出其訓練成本達數千萬美元級別,且在許多任務上仍優于DeepSeek模型。DeepSeek的成本效率更像是AI開發成本自然演進的結果,而非性突破。DeepSeek以更低成本(但遠非600萬美元)實現了接近7-10個月前美國模型水平的產品,這符合AI開發成本每年約下降4倍的歷史趨勢。
2. DeepSeek-V3才是真正的技術突破
Amodei強調,市場關注的R1模型并非DeepSeek真正的技術突破,其更早發布的DeepSeek-V3才是關鍵。V3在某些重要任務上接近美國最先進模型的性能水平,同時大幅降低了訓練成本,這主要歸功于其在“Key-Value cache”管理和混合專家(MoE)方法方面的創新。
3. 企業總投資揭示真實圖景
Amodei指出,DeepSeek據報道擁有約5萬個Hopper一代芯片,這與主要美國AI公司的持有量差距并不大(約為2-3倍以內),成本約為10億美元。這意味著DeepSeek在AI開發上的總體投入與美國同行相差無幾,模型訓練成本與企業總投資之間的區別突顯了雄厚資源在AI開發中的持續重要性。
4. 當前“交叉點”的短暫性
Amodei認為,當前多家公司都能開發出優秀推理模型的情況,只是一種暫時現象,并非新的常態。隨著各公司繼續擴大模型規模,尤其是在資源密集的強化學習領域,行業可能會再次出現分化,資源投入將成為關鍵因素。DeepSeek的成就重要,但并未從根本上改變高級AI開發的長期經濟規律。
總而言之,Amodei的分析表明,DeepSeek的成就并非徹底顛覆AI行業的性突破,而是AI發展進程中一個值得關注的節點。其成本效率的提升符合行業發展趨勢,而其在整體資源投入方面與美國同行差距并不顯著。當前多家公司在推理能力上達到類似水平的局面也只是暫時的,未來AI競爭仍將取決于資源投入和技術創新。
聯系作者
文章來源:AI范兒
作者微信:
作者簡介:專注于探索 AIGC,發掘人工智能的樂趣。