我們理論上可以賺更多錢,但我們沒有。
原標題:DeepSeek一天能賺多少錢?官方突然揭秘V3/R1推理系統,成本全透明
文章來源:機器之心
內容字數:5970字
DeepSeek開源周“One More Thing”:驚人的推理系統和盈利能力
DeepSeek在“開源周”的第五天結束后,出人意料地發布了第六天的內容,介紹了其DeepSeek-V3/R1推理系統的細節,并公布了令人震驚的性能數據和盈利潛力。
驚人的性能數據
DeepSeek-V3/R1推理系統在H800 GPU上實現了極高的吞吐量:每個節點每秒可處理73.7k個輸入token和14.8k個輸出token。 該系統采用跨節點專家并行(EP)、計算-通信重疊和負載平衡等技術來優化吞吐量和延遲。如果所有token都按照DeepSeek-R1的最高價格計算,理論上每日收入可達562,027美元,成本利潤率高達545%。然而,實際收入遠低于此數字,因為V3定價更低,收費服務只占一部分,且夜間有折扣。
高效的系統設計
為了實現高吞吐量和低延遲,DeepSeek-V3/R1采用了以下關鍵設計原則:
- 跨節點專家并行(EP):通過將專家分布到多個GPU上,并利用預填充-解碼分解架構,在不同階段采用不同程度的并行性,顯著擴展batch大小,提高GPU矩陣計算效率。
- 計算-通信重疊:采用“dual-batch”策略和5階段pipeline,隱藏通信延遲,提高吞吐量。
- 負載平衡:針對預填充、解碼和專家并行三個階段分別設計負載平衡器,確保所有GPU的計算和通信負載均衡,避免性能瓶頸。
在線服務統計與盈利分析
在過去24小時內,DeepSeek V3和R1推理服務的峰值節點占用達到278個,平均占用226.75個節點。每日總成本約為87,072美元。總輸入token為608B,輸出token為168B。平均輸出速度為每秒20-22個token。 雖然理論上每日收入可觀,但實際收入遠低于此數字,主要原因是V3定價較低,部分服務免費,以及夜間折扣的應用。
開源周的持續和未來展望
DeepSeek“開源周”意外延長至第六天,并公布了其推理系統的核心技術細節。社區對DeepSeek的持續開源舉動以及其強大的推理系統表現出極大的興趣,并期待開源周最后一天的“壓軸”內容。
聯系作者
文章來源:機器之心
作者微信:
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...