標(biāo)簽:DeepSeek

DeepSeek 開源第二天:DeepEP,AI 訓(xùn)練和推理的超級(jí) “加速器”

原標(biāo)題:DeepSeek 開源第二天:DeepEP,AI 訓(xùn)練和推理的超級(jí) “加速器” 文章來源:小夏聊AIGC 內(nèi)容字?jǐn)?shù):1469字DeepSeek開源再放大招:DeepEP賦能MoE模型,加...
閱讀原文

為什么是梁文鋒做出了DeepSeek?

一個(gè)更清晰的梁文鋒,一個(gè)更明白的關(guān)于DeepSeek的故事。
閱讀原文

來了!DeepSeek 開源 Day 2,DeepEP 再掀 AI 通信,實(shí)在是太 Open了!

來了!DeepSeek 開源 Day 2,DeepEP 再掀 AI 通信革命!\x0a\x0a昨天 DeepSeek AI 剛剛用 FlashMLA 炸了第一波,今天的 DeepEP 更是直接沖著大規(guī)模 AI 訓(xùn)練和...
閱讀原文

剛剛,DeepSeek開源MoE訓(xùn)練、推理EP通信庫DeepEP,真太Open了!

模型層優(yōu)化MoE之外,算力基礎(chǔ)設(shè)施也一起升級(jí)
閱讀原文

文末贈(zèng)書 | 微信、百度都接入的 DeepSeek,企業(yè)靠啥玩轉(zhuǎn)其私有化與垂直訓(xùn)練?

在當(dāng)今數(shù)字化轉(zhuǎn)型的浪潮中,大模型技術(shù)已然成為企業(yè)提升競爭力的關(guān)鍵驅(qū)動(dòng)力。
閱讀原文

清華大學(xué)《DeepSeek從入門到精通》系列版本,普通人必備的AI手冊(cè)(附下載地址)

最近,清華大學(xué)的AI大神制作了一本超詳細(xì)的電子書《DeepSeek從入門到精通》,里面把DeepSeek的基礎(chǔ)知識(shí)和提示詞用法講得通俗易懂,一下子火遍全網(wǎng)! 目前,...
閱讀原文

硅基流動(dòng):押注國產(chǎn)AI算力,Pre-A輪融資后迎來DeepSeek爆發(fā)

原標(biāo)題:硅基流動(dòng):押注國產(chǎn)AI算力,Pre-A輪融資后迎來DeepSeek爆發(fā) 文章來源:小夏聊AIGC 內(nèi)容字?jǐn)?shù):5558字硅基流動(dòng):乘風(fēng)破浪,AI基礎(chǔ)設(shè)施領(lǐng)域的“賽博菩薩”...
閱讀原文

DeepSeek硬控智能家居!四大電視巨頭搶跑,AI眼鏡、智能音箱都上桌了

“藍(lán)鯨魚”DeepSeek游進(jìn)智能家居生態(tài)圈。
閱讀原文

萬字梳理:揭秘 DeepSeek 中的 RL 與 AGI 下一步丨AIR 2025

Transformer架構(gòu)的非遞歸設(shè)計(jì)阻礙了跨層的記憶共享,或限制模型泛化能力。
閱讀原文

文親自上?創(chuàng)業(yè)十多年,DeepSeek梁文峰的“技術(shù)男”屬性從沒改變

2 月 18 日,DeepSeek 發(fā)布了一篇新論文,提出了一種新的注意力機(jī)制——NSA。
閱讀原文

西安交大滿血版Deepseek上線!

可快速創(chuàng)建多種智能體。
閱讀原文

DeepSeek引發(fā)鯰魚效應(yīng),中國算力市場呈現(xiàn)“四變”

這個(gè)AI領(lǐng)域千億級(jí)市場,將輻射千家萬戶。
閱讀原文

剛剛,DeepSeek又發(fā)高質(zhì)量論文,梁文鋒合著!

這篇論文的第一作者在實(shí)習(xí)期間完成了研究。
閱讀原文