DeepSeek是否利空算力?
長遠(yuǎn)來看,算力才是真正的決勝因素。
原標(biāo)題:DeepSeek是否利空算力?
文章來源:智猩猩GenAI
內(nèi)容字?jǐn)?shù):3787字
DeepSeek V3與R1:開源浪潮下的算力博弈
本文總結(jié)了關(guān)于DeepSeek V3和R1模型訓(xùn)練成本及開源對算力市場影響的討論要點(diǎn),主要觀點(diǎn)是:開源模型的崛起,特別是DeepSeek系列,正在重塑AI算力格局,并最終利好整個行業(yè)。
訓(xùn)練成本的:遠(yuǎn)超550萬美元
網(wǎng)絡(luò)廣泛流傳的DeepSeek V3 550萬美元訓(xùn)練成本,僅為其正式訓(xùn)練成本的冰山一角,未包含前期研究、實(shí)驗(yàn)等費(fèi)用。 幻方R1的訓(xùn)練成本更是遠(yuǎn)高于V3,這體現(xiàn)了前沿探索與后發(fā)追趕在算力需求上的巨大差異。
算力效率提升并非成本降低:而是更高效地攫取更大收益
算法進(jìn)步、算力通縮、模型蒸餾等技術(shù)提升了訓(xùn)練效率,但并未降低整體訓(xùn)練成本。相反,這使得模型訓(xùn)練者能夠利用更高的效率,榨取更多算力,以獲得更大的收益。 這解釋了為何即使在算力效率提升后,像幻方這樣的機(jī)構(gòu)仍在面臨算力不足的問題。
開源的勝利:閉源模型的挑戰(zhàn)
DeepSeek的開源,代表著開源模型對閉源模型的一次重大勝利。 這在國內(nèi)已有所體現(xiàn),一些未能趕上開源模型步伐的閉源公司面臨倒閉或轉(zhuǎn)型。 未來,如果閉源模型無法超越開源模型的性能,其API價(jià)值將大幅下降。 然而,這也將導(dǎo)致模型訓(xùn)練參與者的減少。
推理成本的降低:應(yīng)用繁榮的引擎
DeepSeek V3在推理成本上的降低,比訓(xùn)練成本的降低更為顯著。其兼容性強(qiáng),支持多種類型的GPU,這將促進(jìn)LLM應(yīng)用的繁榮,并最終拉動更大的算力需求。 這與早期昂貴的推理成本形成鮮明對比。
北美算力投資的反思:從浪費(fèi)到繁榮
北美大型云服務(wù)提供商過去兩年投入巨資用于算力建設(shè),但其中一部分可能因早期探索而浪費(fèi)。 然而,開源模型的繁榮最終將利好這些云服務(wù)提供商,因?yàn)樗懔π枨髮⑥D(zhuǎn)向推理,而非僅僅是訓(xùn)練。 這印證了“算力才是真正的決勝因素”的觀點(diǎn)。
未來展望:算力與應(yīng)用的雙重增長
未來,算力需求將主要來自推理,而非訓(xùn)練。 開源模型的快速迭代和應(yīng)用生態(tài)的繁榮,將持續(xù)推動算力需求的增長。 這將形成一個良性循環(huán),驅(qū)動整個AI行業(yè)的進(jìn)一步發(fā)展。
聯(lián)系作者
文章來源:智猩猩GenAI
作者微信:
作者簡介:智猩猩旗下賬號,專注于生成式人工智能,主要分享技術(shù)文章、論文成果與產(chǎn)品信息。