中美 AI 創業者的閉門討論:DeepSeek-R1 之后,AI 創業的變化和新趨勢
垂直領域的Agent能力會有大提升。
原標題:中美 AI 創業者的閉門討論:DeepSeek-R1 之后,AI 創業的變化和新趨勢
文章來源:Founder Park
內容字數:10936字
DeepSeek:2025年春節AI焦點與未來趨勢
2025年春節期間,DeepSeek成為AI領域的焦點,其App登頂蘋果商店免費榜,各大云廠商爭相部署其R1模型。本文總結了極客公園組織的閉門討論要點,探討DeepSeek的創新、成本優勢、應用前景及未來趨勢。
DeepSeek的創新之處
DeepSeek V3基座模型參數規模達671B,是目前開源最強模型之一。其R1模型的核心創新在于“反思能力”,通過強化學習(RL)實現,推理能力與OpenAI o1相當,且代碼能力與OpenAI o3 mini不相上下。DeepSeek成功關鍵在于高度集成化的工程方案,有效降低了成本。其方法雖并非全新,但激進地結合使用,并精巧地系統設計,實現了顯著的性能優化。
DeepSeek低成本的秘訣
DeepSeek模型稀疏度極高,推理時僅激活37B參數,大幅降低資源消耗。其在軟件架構上采用MoE架構,動態調整資源使用率,理論上可將成本壓縮至原來的1/256。在訓練階段,DeepSeek摒棄了Tensor Parallelism,只使用Data Parallelism和Pipeline Parallelism,并進行精細的專家并行,從而繞過硬件限制,提高了訓練效率,降低了成本。
Chatbot并非唯一AI入口
DeepSeek R1結合搜索功能,為用戶提供全新的體驗,這對于許多用戶而言是他們第一次接觸推理模型。未來,AI應用型公司的競爭壁壘在于產品體驗,誰能提供更快速、更便捷、更舒適的功能,誰就能在市場中占據優勢。
垂直場景AI落地加速
在垂直場景中,任務評估可通過規則系統完成,無需復雜的獎勵模型,因此7B級別模型即可快速得到可用結果。DeepSeek蒸餾后的中小模型在垂直領域,尤其是有明確答案的任務(如數學計算)中表現出色且成本可控。然而,對于主觀性較強的任務,仍需進一步探索更優的評估方法。
國產芯片助力推理算力
國產芯片在AI應用領域有望追趕英偉達,其瓶頸在于流片。DeepSeek與華為的合作,也體現了國產芯片在穩定供應方面的優勢。專注于AI應用的國產芯片,有望在部分性能指標上追趕英偉達。
更強大的Agent與跨應用調用
未來,更強大的Agent將成為趨勢,通過結合規則模型和基礎模型迭代訓練,并在特定領域實現超人類智能。跨應用調用能力也將成為熱點,但需要解決不同操作系統下的權限管理問題。
總而言之,DeepSeek的出現標志著AI技術和應用的顯著進步,其開源特性降低了AI應用的門檻,推動了垂直領域AI的快速落地。未來,更強大的Agent、跨應用調用能力以及更有效的訓練方法將成為AI領域的研究熱點。
聯系作者
文章來源:Founder Park
作者微信:
作者簡介:來自極客公園,專注與科技創業者聊「真問題」。