「鯰魚」DeepSeek 正在攪動上下游
大模型同行焦慮、云廠「搶食」、芯片廠拼命,DeepSeek 效應(yīng)仍在持續(xù)。
原標題:「鯰魚」DeepSeek 正在攪動上下游
文章來源:AI科技評論
內(nèi)容字數(shù):8690字
DeepSeek 效應(yīng):席卷全球的AI新范式
春節(jié)后的科技圈依舊被DeepSeek效應(yīng)所主導(dǎo)。這款開源模型以其低成本、高性能的特點,引發(fā)了全球范圍內(nèi)的震蕩,其影響波及開源社區(qū)、芯片巨頭、云服務(wù)廠商以及AI創(chuàng)業(yè)公司。
1. DeepSeek的成功與影響
DeepSeek R1模型及其應(yīng)用APP上線后迅速爆火,日活用戶達到2215萬,超過ChatGPT的41.6%,成為全球增速最快的應(yīng)用。其成功并非依賴單一技術(shù),而是多項技術(shù)的完美結(jié)合,包括MoE架構(gòu)、MLA技術(shù)以及強大的工程能力。DeepSeek開源的策略也為整個大模型發(fā)展注入了新的活力,并有望在圖像、視頻等領(lǐng)域進一步擴展。
DeepSeek的低成本特性,直接沖擊了OpenAI的商業(yè)模式,后者被迫向免費用戶提供o3-mini模型及推理思維鏈以應(yīng)對競爭。 DeepSeek也推動了國內(nèi)AI產(chǎn)業(yè)的團結(jié),上游芯片廠商、中間層云廠和下游創(chuàng)業(yè)公司都積極參與到其生態(tài)建設(shè)中。
2. 第三方推理服務(wù)的機遇
DeepSeek APP服務(wù)器的繁忙,也間接催生了第三方推理服務(wù)的興起。國內(nèi)外云巨頭紛紛上線DeepSeek模型API,掀起新一輪價格戰(zhàn)。這與當年微軟云綁定OpenAI的策略類似,但DeepSeek的開源性使其生態(tài)更為開放,更多廠商能夠參與其中。
國內(nèi)外眾多AI基礎(chǔ)設(shè)施廠商,例如硅基流動、潞晨科技、趨境科技等,也紛紛推出DeepSeek模型的本地化部署優(yōu)化方案,以滿足不同用戶的需求。這些廠商在提供DeepSeek API服務(wù)后,都獲得了顯著的客戶增長。
3. “顛覆英偉達”的冷思考
DeepSeek的出現(xiàn),也對英偉達的市場地位造成沖擊,使其股價大幅下跌。然而,這種沖擊主要體現(xiàn)在高端算力領(lǐng)域,尤其是在推理側(cè)。DeepSeek對CUDA的依賴,以及國產(chǎn)芯片在訓(xùn)練方面的不足,使得英偉達在訓(xùn)練環(huán)節(jié)的霸主地位短期內(nèi)難以撼動。
國產(chǎn)芯片廠商紛紛適配DeepSeek模型,主要集中在推理應(yīng)用方面,這為其提供了重要的發(fā)展機遇。雖然在適配過程中仍然存在一些工程難題,但國產(chǎn)芯片在推理側(cè)的進步是顯著的。DeepSeek的成功也推動了國產(chǎn)算力生態(tài)的建設(shè),為和企業(yè)智能化發(fā)展提供了新的可能性。
4. 挑戰(zhàn)與展望
DeepSeek的成功也帶來了新的挑戰(zhàn),例如如何平衡大模型的使用效果和成本,以及如何滿足用戶對大模型能力的更高期待。 但總的來說,DeepSeek的出現(xiàn),降低了大模型的訓(xùn)練、推理和應(yīng)用成本,推動了整個AI產(chǎn)業(yè)的快速發(fā)展,并為國產(chǎn)AI產(chǎn)業(yè)帶來了新的機遇和信心。
聯(lián)系作者
文章來源:AI科技評論
作者微信:
作者簡介:雷峰網(wǎng)旗下AI新媒體。聚焦AI前沿研究,關(guān)注AI工程落地。