Lex Fridman 五小時聊 DeepSeek:一文看懂 DeepSeek 的創(chuàng)新與2025 AI 趨勢
中美 AI 競爭與國運。

原標(biāo)題:Lex Fridman 五小時聊 DeepSeek:一文看懂 DeepSeek 的創(chuàng)新與2025 AI 趨勢
文章來源:Founder Park
內(nèi)容字?jǐn)?shù):107785字
DeepSeek引發(fā)的AI熱議:Lex Fridman與專家深度對話
知名科技主播Lex Fridman近期邀請半導(dǎo)體分析公司SemiAnalysis運營總監(jiān)Dylan Patel和艾倫人工智能研究所研究科學(xué)家Nathan Lambert,就DeepSeek及其開源模型V3和R1展開長達(dá)5小時的討論,內(nèi)容涵蓋DeepSeek的創(chuàng)新、AI算力瓶頸、模型訓(xùn)練和蒸餾、以及商業(yè)落地等多個方面。本文精選5萬字核心內(nèi)容,濃縮要點如下:
1. DeepSeek模型的開源與創(chuàng)新
DeepSeek-V3是一個開源權(quán)重指令模型,類似ChatGPT;DeepSeek-R1則是其推理模型,采用寬松的MIT許可證,在開源程度上領(lǐng)先業(yè)界。DeepSeek在技術(shù)報告中詳細(xì)披露了訓(xùn)練細(xì)節(jié),包括在CUDA底層對GPU的優(yōu)化,展現(xiàn)了其技術(shù)實力。
2. 預(yù)訓(xùn)練與后訓(xùn)練:模型訓(xùn)練的兩個階段
模型訓(xùn)練分為預(yù)訓(xùn)練(學(xué)言規(guī)律)和后訓(xùn)練(提升易用性、對齊等)兩個階段。后訓(xùn)練包括指令微調(diào)、偏好微調(diào)(RLHF)以及強(qiáng)化微調(diào)等,DeepSeek-R1使用了更先進(jìn)的強(qiáng)化學(xué)習(xí)技術(shù),使其能夠展現(xiàn)推理過程。
3. DeepSeek低成本訓(xùn)練的秘訣
DeepSeek通過混合專家模型(MoE)和潛在注意力(MLA)技術(shù)降低訓(xùn)練成本。MoE模擬人腦機(jī)制,只激活部分參數(shù),降低計算量;MLA則減少內(nèi)存占用。DeepSeek甚至在CUDA底層進(jìn)行了GPU優(yōu)化,充分利用有限的算力資源。
4. R1的推理能力與用戶體驗
DeepSeek-R1在生成答案前會展現(xiàn)詳細(xì)的推理過程,讓用戶直觀了解模型的思考步驟,提升了用戶體驗,也引發(fā)了公眾對AI“意識”的討論。
5. 模型訓(xùn)練的“All in”策略與挑戰(zhàn)
大型模型訓(xùn)練如同“YOLO”(You Only Live Once)運行,需要大量實驗和資源投入。DeepSeek通過多次小規(guī)模實驗積累經(jīng)驗,最終進(jìn)行大規(guī)模訓(xùn)練,這體現(xiàn)了其技術(shù)積累和風(fēng)險承擔(dān)能力。
6. 出口管制的影響與AI應(yīng)用普及
美國對華出口管制主要影響了中國AI應(yīng)用的普及速度,而非完全阻止AI技術(shù)發(fā)展。DeepSeek的成功表明,即使在算力受限的情況下,中國仍然能夠訓(xùn)練出先進(jìn)的AI模型。
7. 模型對齊與審查:技術(shù)與倫理的挑戰(zhàn)
模型對齊可以在數(shù)據(jù)選擇、預(yù)訓(xùn)練、后訓(xùn)練等多個階段進(jìn)行,但完全避免審查幾乎不可能。DeepSeek等模型的“審查”可能源于數(shù)據(jù)偏見或后訓(xùn)練策略。
8. 模型蒸餾:行業(yè)慣例與倫理爭議
模型蒸餾是行業(yè)慣例,但使用其他公司模型輸出進(jìn)行訓(xùn)練是否違規(guī),存在法律和倫理爭議。OpenAI等公司對模型輸出的控制力有限,而DeepSeek在效率提升方面的努力仍然值得肯定。
9. AI Agent的挑戰(zhàn)與前景
AI Agent的自主性和可靠性是主要挑戰(zhàn)。目前Agent應(yīng)用的成功率有限,未來可能需要結(jié)合人工輔助,逐步提升可靠性,才能在開放環(huán)境中廣泛應(yīng)用。
10. AGI競賽與未來展望
專家們普遍認(rèn)為AGI的出現(xiàn)時間在2030年之后。AGI競賽并非“贏家通吃”,多家公司可能在不同領(lǐng)域取得成功。未來AI應(yīng)用將更加多樣化,包括AI Agent、機(jī)器人技術(shù)、以及各行各業(yè)的自動化等。
總而言之,DeepSeek的出現(xiàn)標(biāo)志著AI技術(shù)發(fā)展進(jìn)入新的階段,開源與高效訓(xùn)練成為重要趨勢。未來AI發(fā)展將持續(xù)帶來驚喜,但也面臨著倫理、社會等方面的挑戰(zhàn),需要謹(jǐn)慎應(yīng)對。
聯(lián)系作者
文章來源:Founder Park
作者微信:
作者簡介:來自極客公園,專注與科技創(chuàng)業(yè)者聊「真問題」。

粵公網(wǎng)安備 44011502001135號