標(biāo)簽:DeepSeek模型

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經(jīng)常用來(lái)日常寫(xiě)作,雖然本身提供了AI功能,但可惜需要會(huì)員,本文教你三分鐘接入最火的DeepSeek,讓W(xué)PS秒變辦公神器。 DeepSeek API申請(qǐng)地址:http:/...
閱讀原文

AI賺錢(qián)副業(yè)~AI生成影視解說(shuō),半個(gè)月漲粉變現(xiàn)3.5W+!

這兩年大家都在感嘆生活不易,然而我想說(shuō)的是,機(jī)會(huì)還是有的,但問(wèn)題不在于有沒(méi)有,而在于你是否能夠認(rèn)準(zhǔn)機(jī)會(huì),然后抓住它。 接觸過(guò)很多咨詢項(xiàng)目的人,發(fā)現(xiàn)...

DeepSeek的多頭潛在注意力(MLA)和11種KV-Cache技巧演進(jìn)大總結(jié)

總結(jié)11篇最近的研究論文,歸納三大類(lèi)。
閱讀原文

4w Star!一個(gè)低成本微調(diào)DeepSeek的開(kāi)源方案,悄悄火了

原標(biāo)題:4w Star!一個(gè)低成本微調(diào)DeepSeek的開(kāi)源方案,悄悄火了 文章來(lái)源:夕小瑤科技說(shuō) 內(nèi)容字?jǐn)?shù):4344字基于Colossal-AI低成本構(gòu)建高質(zhì)量私有DeepSeek模型 ...
閱讀原文

DeepSeek發(fā)布NSA:超快速長(zhǎng)上下文訓(xùn)練與推理的新突破

原標(biāo)題:DeepSeek發(fā)布NSA:超快速長(zhǎng)上下文訓(xùn)練與推理的新突破 文章來(lái)源:小夏聊AIGC 內(nèi)容字?jǐn)?shù):3860字DeepSeek's NSA: A Breakthrough in Accelerating AI Mo...
閱讀原文

架構(gòu)創(chuàng)新×模型創(chuàng)新!清微智能全面適配DeepSeek模型推理和訓(xùn)練

原標(biāo)題:架構(gòu)創(chuàng)新×模型創(chuàng)新!清微智能全面適配DeepSeek模型推理和訓(xùn)練 文章來(lái)源:新智元 內(nèi)容字?jǐn)?shù):1652字國(guó)產(chǎn)AI芯片新突破:清微智能RPU助力大模型高效運(yùn)行 ...
閱讀原文