大模型同行焦慮、云廠「搶食」、芯片廠拼命,DeepSeek 效應仍在持續。
原標題:「鯰魚」DeepSeek 正在攪動上下游
文章來源:AI科技評論
內容字數:8690字
DeepSeek 效應:席卷全球的AI新范式
春節后的科技圈依舊被DeepSeek效應所主導。這款開源模型以其低成本、高性能的特點,引發了全球范圍內的震蕩,其影響波及開源社區、芯片巨頭、云服務廠商以及AI創業公司。
1. DeepSeek的成功與影響
DeepSeek R1模型及其應用APP上線后迅速爆火,日活用戶達到2215萬,超過ChatGPT的41.6%,成為全球增速最快的應用。其成功并非依賴單一技術,而是多項技術的完美結合,包括MoE架構、MLA技術以及強大的工程能力。DeepSeek開源的策略也為整個大模型發展注入了新的活力,并有望在圖像、視頻等領域進一步擴展。
DeepSeek的低成本特性,直接沖擊了OpenAI的商業模式,后者被迫向免費用戶提供o3-mini模型及推理思維鏈以應對競爭。 DeepSeek也推動了國內AI產業的團結,上游芯片廠商、中間層云廠和下游創業公司都積極參與到其生態建設中。
2. 第三方推理服務的機遇
DeepSeek APP服務器的繁忙,也間接催生了第三方推理服務的興起。國內外云巨頭紛紛上線DeepSeek模型API,掀起新一輪價格戰。這與當年微軟云綁定OpenAI的策略類似,但DeepSeek的開源性使其生態更為開放,更多廠商能夠參與其中。
國內外眾多AI基礎設施廠商,例如硅基流動、潞晨科技、趨境科技等,也紛紛推出DeepSeek模型的本地化部署優化方案,以滿足不同用戶的需求。這些廠商在提供DeepSeek API服務后,都獲得了顯著的客戶增長。
3. “顛覆英偉達”的冷思考
DeepSeek的出現,也對英偉達的市場地位造成沖擊,使其股價大幅下跌。然而,這種沖擊主要體現在高端算力領域,尤其是在推理側。DeepSeek對CUDA的依賴,以及國產芯片在訓練方面的不足,使得英偉達在訓練環節的霸主地位短期內難以撼動。
國產芯片廠商紛紛適配DeepSeek模型,主要集中在推理應用方面,這為其提供了重要的發展機遇。雖然在適配過程中仍然存在一些工程難題,但國產芯片在推理側的進步是顯著的。DeepSeek的成功也推動了國產算力生態的建設,為和企業智能化發展提供了新的可能性。
4. 挑戰與展望
DeepSeek的成功也帶來了新的挑戰,例如如何平衡大模型的使用效果和成本,以及如何滿足用戶對大模型能力的更高期待。 但總的來說,DeepSeek的出現,降低了大模型的訓練、推理和應用成本,推動了整個AI產業的快速發展,并為國產AI產業帶來了新的機遇和信心。
聯系作者
文章來源:AI科技評論
作者微信:
作者簡介:雷峰網旗下AI新媒體。聚焦AI前沿研究,關注AI工程落地。