標簽:DeepSeek

DeepSeek 開源第二天:DeepEP,AI 訓練和推理的超級 “加速器”

原標題:DeepSeek 開源第二天:DeepEP,AI 訓練和推理的超級 “加速器” 文章來源:小夏聊AIGC 內容字數:1469字DeepSeek開源再放大招:DeepEP賦能MoE模型,加...
閱讀原文

為什么是梁文鋒做出了DeepSeek?

一個更清晰的梁文鋒,一個更明白的關于DeepSeek的故事。
閱讀原文

來了!DeepSeek 開源 Day 2,DeepEP 再掀 AI 通信,實在是太 Open了!

來了!DeepSeek 開源 Day 2,DeepEP 再掀 AI 通信革命!\x0a\x0a昨天 DeepSeek AI 剛剛用 FlashMLA 炸了第一波,今天的 DeepEP 更是直接沖著大規模 AI 訓練和...
閱讀原文

剛剛,DeepSeek開源MoE訓練、推理EP通信庫DeepEP,真太Open了!

模型層優化MoE之外,算力基礎設施也一起升級
閱讀原文

文末贈書 | 微信、百度都接入的 DeepSeek,企業靠啥玩轉其私有化與垂直訓練?

在當今數字化轉型的浪潮中,大模型技術已然成為企業提升競爭力的關鍵驅動力。
閱讀原文

清華大學《DeepSeek從入門到精通》系列版本,普通人必備的AI手冊(附下載地址)

最近,清華大學的AI大神制作了一本超詳細的電子書《DeepSeek從入門到精通》,里面把DeepSeek的基礎知識和提示詞用法講得通俗易懂,一下子火遍全網! 目前,...
閱讀原文

硅基流動:押注國產AI算力,Pre-A輪融資后迎來DeepSeek爆發

原標題:硅基流動:押注國產AI算力,Pre-A輪融資后迎來DeepSeek爆發 文章來源:小夏聊AIGC 內容字數:5558字硅基流動:乘風破浪,AI基礎設施領域的“賽博菩薩”...
閱讀原文

萬字梳理:揭秘 DeepSeek 中的 RL 與 AGI 下一步丨AIR 2025

Transformer架構的非遞歸設計阻礙了跨層的記憶共享,或限制模型泛化能力。
閱讀原文

文親自上?創業十多年,DeepSeek梁文峰的“技術男”屬性從沒改變

2 月 18 日,DeepSeek 發布了一篇新論文,提出了一種新的注意力機制——NSA。
閱讀原文

西安交大滿血版Deepseek上線!

可快速創建多種智能體。
閱讀原文

DeepSeek引發鯰魚效應,中國算力市場呈現“四變”

這個AI領域千億級市場,將輻射千家萬戶。
閱讀原文

剛剛,DeepSeek又發高質量論文,梁文鋒合著!

這篇論文的第一作者在實習期間完成了研究。
閱讀原文