就在最近,谷歌 DeepMind 圍繞 DeepSeek 模型成果及其低成本所發表的看法再一次受到關注與熱議。2
原標題:DeepMind 也酸了?CEO 怒噴 DeepSeek 成本是炒作:很多技術都來自谷歌和 DeepMind
文章來源:AI前線
內容字數:8107字
DeepSeek 模型引發熱議:成本、技術及未來
近日,谷歌DeepMind CEO Demis Hassabis 對中國人工智能模型DeepSeek 的評價引發熱議。他認為DeepSeek 完成了“極其出色的工程”,但在技術上并無突破性進展,其使用的技術多為谷歌和DeepMind已有的技術。同時,他駁斥了DeepSeek顛覆人工智能開發經濟學的觀點,認為其成本效益并非例外。
1. 557.6萬美元訓練成本的“誤會”:DeepSeek公布的訓練成本僅為最后一輪訓練的成本,而非總成本。研究機構SemiAnalysis估算,DeepSeek的實際硬件支出遠超5億美元,這還不包括架構設計、算法研發、數據收集等成本。他們認為,DeepSeek的低成本是AI領域成本下降趨勢的體現,而非技術突破。 與之相比,Claude 3.5 Sonnet的訓練成本也高達數千萬美元,這說明DeepSeek的成本優勢并非顛覆性的。
2. DeepSeek背后的巨額投入:DeepSeek母公司幻方量化投入巨大,擁有超過5萬張高端GPU,總服務器資本支出約為16億美元,運營成本高達9.44億美元。此外,DeepSeek還為頂尖人才提供超過130萬美元的年薪,人力成本不容忽視。雖然DeepSeek公開的員工數量較少,但實際團隊規模可能更大,許多員工可能借調自幻方量化。
3. DeepSeek的獨特之處:盡管成本并非性突破,但SemiAnalysis認為DeepSeek的獨特之處在于率先實現了強大的成本與能力組合。其低廉的成本是AI算法進步和算力提升的自然結果,但DeepSeek率先實現了這種組合,這使其在市場上具有競爭力。預計到今年年底,其服務成本還將進一步降低。
4. DeepSeek的未來:DeepSeek作為一個嚴肅項目,持續獲得巨額資金支持,并積極招攬人才,其未來發展值得關注。其低成本的模型和技術積累,可能會對人工智能領域產生深遠的影響。
聯系作者
文章來源:AI前線
作者微信:
作者簡介:面向AI愛好者、開發者和科學家,提供大模型最新資訊、AI技術分享干貨、一線業界實踐案例,助你全面擁抱AIGC。