「DeepSeek大解讀」系列公開課啟動!前兩期深入講解DeepSeek V3/R1架構(gòu),以及PTX與CUDA
深入講解DeepSeek V3/R1架構(gòu),以及PTX與CUDA~
原標(biāo)題:「DeepSeek大解讀」系列公開課啟動!前兩期深入講解DeepSeek V3/R1架構(gòu),以及PTX與CUDA
文章來源:智猩猩GenAI
內(nèi)容字?jǐn)?shù):1959字
DeepSeek大模型引爆全球,開啟“龍卷風(fēng)”式發(fā)展
文章主要介紹了DeepSeek公司及其發(fā)布的基座模型V3和推理模型R1,這兩個模型被譽(yù)為“國運(yùn)級創(chuàng)新”,在全球范圍內(nèi)引發(fā)巨大反響,并對人工智能產(chǎn)業(yè)產(chǎn)生了深遠(yuǎn)影響。文章重點(diǎn)闡述了DeepSeek的技術(shù)創(chuàng)新及其帶來的影響,并介紹了智猩猩策劃的“DeepSeek大解讀”系列公開課。
1. DeepSeek:大模型領(lǐng)域的“最強(qiáng)挑戰(zhàn)者”
DeepSeek公司憑借其在算法和工程方面的創(chuàng)新,突破了算力,在全球范圍內(nèi)迅速崛起,成為OpenAI最強(qiáng)勁的競爭對手。其開源的推理模型R1更是成為了新晉開源王者,DeepSeek在大模型領(lǐng)域以及AGI進(jìn)程的探索中躋身第一陣營。在國內(nèi),DeepSeek打破了現(xiàn)有格局,遙遙領(lǐng)先,為國內(nèi)人工智能產(chǎn)業(yè)帶來了方向和信心。
2. V3和R1模型的創(chuàng)新
DeepSeek的成功源于其在V3和R1模型中所做的創(chuàng)新工作。文章指出,這些創(chuàng)新工作才剛剛開始對國內(nèi)乃至全球的技術(shù)和產(chǎn)業(yè)產(chǎn)生影響。
3. “DeepSeek大解讀”系列公開課
為了深入解讀DeepSeek的技術(shù)創(chuàng)新和價值,智猩猩策劃了“DeepSeek大解讀”系列公開課,邀請學(xué)術(shù)界和工業(yè)界的專家進(jìn)行講解。公開課采用直播形式,每期包含主講和問答環(huán)節(jié)。
4. 第一期:MoE架構(gòu)深度分析
第一期公開課由中存算董事長陳巍博士主講,主題為《DeepSeek V3/R1架構(gòu)的深度分析與深度思考》。陳博士將從MoE模型架構(gòu)和低比特訓(xùn)練框架創(chuàng)新的角度,深入分析V3和R1的架構(gòu)、訓(xùn)練流程和訓(xùn)練框架設(shè)計思想,并對大模型發(fā)展路線和算力芯片范式共生進(jìn)行深度思考。時間為2月11日15點(diǎn)。
5. 第二期:PTX與CUDA詳解
第二期公開課由中科院計算所處理器芯片全國重點(diǎn)實(shí)驗(yàn)室副研究員趙家程博士主講,主題為《PTX與CUDA:性能、兼容性與生態(tài)系統(tǒng)》。由于DeepSeek繞開NVIDIA CUDA壟斷引發(fā)爭議,本期將對GPGPU底層編程方法及其在LLM訓(xùn)練與推理中的應(yīng)用進(jìn)行講解。時間為2月13日19點(diǎn)。
6. 報名方式
感興趣的讀者可以通過掃描二維碼添加小助手“小石頭”,發(fā)送“DeepSeek”報名參加直播,并可申請加入第一期或第二期的交流群,與更多同仁探討相關(guān)話題。
7. 后續(xù)規(guī)劃
“DeepSeek大解讀”系列公開課后續(xù)還將推出更多主題,敬請期待。
總而言之,DeepSeek的出現(xiàn),標(biāo)志著大模型領(lǐng)域競爭格局的重大變化,其技術(shù)創(chuàng)新及其對產(chǎn)業(yè)的影響值得持續(xù)關(guān)注。“DeepSeek大解讀”系列公開課為業(yè)內(nèi)人士深入了解DeepSeek提供了寶貴機(jī)會。
聯(lián)系作者
文章來源:智猩猩GenAI
作者微信:
作者簡介:智猩猩旗下賬號,專注于生成式人工智能,主要分享技術(shù)文章、論文成果與產(chǎn)品信息。