標(biāo)簽:DeepSeek
DeepSeek 開源第二天:DeepEP,AI 訓(xùn)練和推理的超級(jí) “加速器”
原標(biāo)題:DeepSeek 開源第二天:DeepEP,AI 訓(xùn)練和推理的超級(jí) “加速器” 文章來源:小夏聊AIGC 內(nèi)容字?jǐn)?shù):1469字DeepSeek開源再放大招:DeepEP賦能MoE模型,加...
來了!DeepSeek 開源 Day 2,DeepEP 再掀 AI 通信,實(shí)在是太 Open了!
來了!DeepSeek 開源 Day 2,DeepEP 再掀 AI 通信革命!\x0a\x0a昨天 DeepSeek AI 剛剛用 FlashMLA 炸了第一波,今天的 DeepEP 更是直接沖著大規(guī)模 AI 訓(xùn)練和...
文末贈(zèng)書 | 微信、百度都接入的 DeepSeek,企業(yè)靠啥玩轉(zhuǎn)其私有化與垂直訓(xùn)練?
在當(dāng)今數(shù)字化轉(zhuǎn)型的浪潮中,大模型技術(shù)已然成為企業(yè)提升競爭力的關(guān)鍵驅(qū)動(dòng)力。
清華大學(xué)《DeepSeek從入門到精通》系列版本,普通人必備的AI手冊(cè)(附下載地址)
最近,清華大學(xué)的AI大神制作了一本超詳細(xì)的電子書《DeepSeek從入門到精通》,里面把DeepSeek的基礎(chǔ)知識(shí)和提示詞用法講得通俗易懂,一下子火遍全網(wǎng)! 目前,...
硅基流動(dòng):押注國產(chǎn)AI算力,Pre-A輪融資后迎來DeepSeek爆發(fā)
原標(biāo)題:硅基流動(dòng):押注國產(chǎn)AI算力,Pre-A輪融資后迎來DeepSeek爆發(fā) 文章來源:小夏聊AIGC 內(nèi)容字?jǐn)?shù):5558字硅基流動(dòng):乘風(fēng)破浪,AI基礎(chǔ)設(shè)施領(lǐng)域的“賽博菩薩”...
萬字梳理:揭秘 DeepSeek 中的 RL 與 AGI 下一步丨AIR 2025
Transformer架構(gòu)的非遞歸設(shè)計(jì)阻礙了跨層的記憶共享,或限制模型泛化能力。
文親自上?創(chuàng)業(yè)十多年,DeepSeek梁文峰的“技術(shù)男”屬性從沒改變
2 月 18 日,DeepSeek 發(fā)布了一篇新論文,提出了一種新的注意力機(jī)制——NSA。