DeepSeek很強,但作業難抄。
原標題:月虧4億 vs 毛利545%:MaaS商業模式的羅生門|甲子光年
文章來源:甲子光年
內容字數:14572字
DeepSeek引發的MaaS商業模式大討論
本文探討了圍繞DeepSeek大模型引發的MaaS(模型即服務)商業模式的爭議,并試圖理清各方觀點的合理性。
1. MaaS模式的本質與演變
MaaS是云計算產業鏈的新生態,分為兩類:一類是像智譜、阿里云這樣的大模型公司或云廠商,自研大模型并提供服務;另一類是像潞晨科技、硅基流動這樣,提供第三方開源模型的MaaS服務,即“AI推理云服務”。開源模型的出現,降低了大模型服務的準入門檻,激發了AI推理云服務的興起,也使得大模型token價格有下降空間。
2. DeepSeek:高性能與高門檻
DeepSeek大模型性能強勁,但其商業模式的盈利能力卻引發爭議。潞晨科技創始人尤洋認為,基于token計費的MaaS模式在現有算力成本下難以盈利,甚至可能月虧損4億。硅基流動創始人袁進輝則反駁,認為尤洋的成本估算過于夸張,并指出DeepSeek官方公布的基于“MLA+DeepSeek MoE+專家并行”架構的部署策略,成本利潤率高達545%。
爭議的核心在于DeepSeek的推理效率。尤洋的計算基于較低的token生成速度,而DeepSeek官方及其他廠商的數據顯示,通過優化,吞吐率可提升數倍甚至十倍以上,從而大幅降低成本,實現盈利。然而,DeepSeek的高效部署策略并非易于復制,其獨特的架構和軟硬件協同優化能力是關鍵。
3. DeepSeek MoE架構與技術挑戰
DeepSeek采用MoE(混合專家)模型和專家并行策略,這與主流的Dense模型和張量并行策略不同。MoE模型通過激活特定專家來處理任務,提高效率,但需要復雜的部署和優化。DeepSeek的部署方案需要至少320張GPU卡,對資源和技術能力要求極高,這使得其他廠商難以復現其低成本高效率的模式。業內專家認為,DeepSeek的MoE架構更適合大廠或在C端有野心的公司。
4. 成本降低的兩種途徑:工程優化與架構創新
大模型成本降低主要依靠工程優化和架構創新。DeepSeek的“MLA+DeepSeek MoE+專家并行”架構是工程優化的典范,而其他公司如月之暗面也在工程優化方面取得了顯著成果。與此同時,對注意力機制的改進,如DeepSeek的MLA和月之暗面的MoBA,以及硬件層面的創新,也推動了成本下降。
5. 結論:兩種觀點的融合
尤洋和袁進輝的觀點并非完全對立。尤洋強調當前技術水平的限制,而袁進輝則著眼于未來的技術可能性。DeepSeek的成功表明,通過極致的工程優化和架構創新,MaaS模式是可行的,但對于大多數廠商而言,這仍然是一個高門檻的挑戰。DeepSeek的成功,也為AI普惠時代開啟了新的可能性。
聯系作者
文章來源:甲子光年
作者微信:
作者簡介:甲子光年是一家科技智庫,包含智庫、社群、企業服務版塊,立足中國科技創新前沿陣地,動態跟蹤頭部科技企業發展和傳統產業技術升級案例,推動人工智能、大數據、物聯網、云計算、新能源、新材料、信息安全、大健康等科技創新在產業中的應用與落地。