長遠來看,算力才是真正的決勝因素。
原標題:DeepSeek是否利空算力?
文章來源:智猩猩GenAI
內容字數:3787字
DeepSeek V3與R1:開源浪潮下的算力博弈
本文總結了關于DeepSeek V3和R1模型訓練成本及開源對算力市場影響的討論要點,主要觀點是:開源模型的崛起,特別是DeepSeek系列,正在重塑AI算力格局,并最終利好整個行業。
訓練成本的:遠超550萬美元
網絡廣泛流傳的DeepSeek V3 550萬美元訓練成本,僅為其正式訓練成本的冰山一角,未包含前期研究、實驗等費用。 幻方R1的訓練成本更是遠高于V3,這體現了前沿探索與后發追趕在算力需求上的巨大差異。
算力效率提升并非成本降低:而是更高效地攫取更大收益
算法進步、算力通縮、模型蒸餾等技術提升了訓練效率,但并未降低整體訓練成本。相反,這使得模型訓練者能夠利用更高的效率,榨取更多算力,以獲得更大的收益。 這解釋了為何即使在算力效率提升后,像幻方這樣的機構仍在面臨算力不足的問題。
開源的勝利:閉源模型的挑戰
DeepSeek的開源,代表著開源模型對閉源模型的一次重大勝利。 這在國內已有所體現,一些未能趕上開源模型步伐的閉源公司面臨倒閉或轉型。 未來,如果閉源模型無法超越開源模型的性能,其API價值將大幅下降。 然而,這也將導致模型訓練參與者的減少。
推理成本的降低:應用繁榮的引擎
DeepSeek V3在推理成本上的降低,比訓練成本的降低更為顯著。其兼容性強,支持多種類型的GPU,這將促進LLM應用的繁榮,并最終拉動更大的算力需求。 這與早期昂貴的推理成本形成鮮明對比。
北美算力投資的反思:從浪費到繁榮
北美大型云服務提供商過去兩年投入巨資用于算力建設,但其中一部分可能因早期探索而浪費。 然而,開源模型的繁榮最終將利好這些云服務提供商,因為算力需求將轉向推理,而非僅僅是訓練。 這印證了“算力才是真正的決勝因素”的觀點。
未來展望:算力與應用的雙重增長
未來,算力需求將主要來自推理,而非訓練。 開源模型的快速迭代和應用生態的繁榮,將持續推動算力需求的增長。 這將形成一個良性循環,驅動整個AI行業的進一步發展。
聯系作者
文章來源:智猩猩GenAI
作者微信:
作者簡介:智猩猩旗下賬號,專注于生成式人工智能,主要分享技術文章、論文成果與產品信息。