DeepSeek測算:算力、性能、成本等
原標(biāo)題:DeepSeek測算:算力、性能、成本等
文章來源:人工智能學(xué)家
內(nèi)容字?jǐn)?shù):25808字
DeepSeek:中國AI實驗室的崛起與全球影響
本文分析了SemiAnalysis報告中關(guān)于中國AI實驗室DeepSeek的深度解讀,涵蓋其成本、性能、人才策略以及對全球AI行業(yè)的影響。DeepSeek的迅速崛起,引發(fā)了全球范圍內(nèi)的熱議,其日流量已超越眾多國際知名AI模型。
1. DeepSeek的背景與資源
DeepSeek由中國量化對沖基金幻方量化于2023年5月成立,初期融資完全由幻方提供。 報告估計,DeepSeek在GPU方面的投資已超過5億美元,擁有約50,000張英偉達Hopper架構(gòu)GPU,其中包括約10,000張H800、10,000張H100以及大量H20 GPU。其總服務(wù)器資本支出約為13億美元,集群運營成本高達7.15億美元。
2. DeepSeek的人才戰(zhàn)略
DeepSeek注重實際能力,而非學(xué)歷背景,為頂尖研究人員提供超過130萬美元的年薪,吸引了大量中國本土人才。其靈活的組織架構(gòu)和“隨意使用數(shù)萬張GPU”的招聘策略,極具吸引力。
3. DeepSeek的模型性能與成本
DeepSeek V3和R1模型的性能引發(fā)熱議。雖然DeepSeek V3的訓(xùn)練成本被報道為約600萬美元,但報告指出這僅是預(yù)訓(xùn)練成本,實際成本遠高于此,包括研發(fā)、數(shù)據(jù)處理、人才成本和硬件TCO等。DeepSeek R1的性能與OpenAI的o1相當(dāng),但報告強調(diào),R1的論文并未公布所有基準(zhǔn)測試結(jié)果,且Google的Gemini Flash 2.0 Thinking在某些方面表現(xiàn)更優(yōu),成本也更低。
4. DeepSeek的技術(shù)突破
DeepSeek在多項技術(shù)上取得突破,包括:
- 多Token預(yù)測(MTP):提升訓(xùn)練效率。
- FP8訓(xùn)練:提升計算資源利用率。
- 混合專家模型(MoE):提高訓(xùn)練效率和降低推理成本。
- 強化學(xué)習(xí)(RL):提升R1的推理能力。
- 多頭潛在注意力(MLA):大幅降低推理成本。
5. DeepSeek的商業(yè)模式與市場影響
DeepSeek可能目前正在補貼推理價格以搶占市場份額,其低成本策略可能會影響整個AI行業(yè)的商業(yè)模式。 報告認(rèn)為,DeepSeek的崛起并非完全顛覆OpenAI,而是以更低的價格實現(xiàn)了相當(dāng)?shù)哪芰Γ@類似于半導(dǎo)體行業(yè)中新技術(shù)節(jié)點的競爭格局。
6. 出口管制與DeepSeek的未來
美國的出口管制對DeepSeek的GPU獲取造成一定限制,但并未完全阻止其發(fā)展。 報告預(yù)測,未來出口管制可能會進一步收緊,DeepSeek的擴張能力將面臨挑戰(zhàn)。 中國對AI產(chǎn)業(yè)的大力扶持,將有助于DeepSeek未來的發(fā)展,但也可能導(dǎo)致其不再開源模型。
7. 總結(jié)
DeepSeek的崛起展現(xiàn)了中國AI領(lǐng)域的快速發(fā)展和巨大潛力。其低成本高性能的模型以及靈活的人才策略,對全球AI行業(yè)產(chǎn)生了重大影響。 然而,DeepSeek也面臨著來自出口管制和市場競爭的挑戰(zhàn)。未來的發(fā)展,仍充滿不確定性。
聯(lián)系作者
文章來源:人工智能學(xué)家
作者微信:
作者簡介:致力成為權(quán)威的人工智能科技媒體和前沿科技研究機構(gòu)