DeepSeek怎么用?怎么本地部署?老金手把手教你!
加我進(jìn)AI討論學(xué)習(xí)群,公眾號(hào)右下角“聯(lián)系方式”\x0d\x0a\x0d\x0a關(guān)注發(fā)送“知識(shí)精華”,可獲得免費(fèi)的知識(shí)鏈接地址
原標(biāo)題:DeepSeek怎么用?怎么本地部署?老金手把手教你!
文章來(lái)源:金子的知識(shí)星球
內(nèi)容字?jǐn)?shù):7439字
DeepSeek:價(jià)格屠夫與框架王者
新年好!年前忙碌,年后終于可以和大家聊聊最近大火的DeepSeek了。它以低廉的價(jià)格和強(qiáng)大的性能,迅速成為AI領(lǐng)域的一匹黑馬,被譽(yù)為“價(jià)格屠夫”。本文將從DeepSeek的優(yōu)勢(shì)、使用方法以及本地部署等方面進(jìn)行詳細(xì)解讀。
一、DeepSeek的獨(dú)特之處:框架為王
DeepSeek最初讓我印象深刻的是它的價(jià)格,相較于國(guó)外動(dòng)輒上千億美元訓(xùn)練的模型,它僅需500多萬(wàn)就能達(dá)到相當(dāng)?shù)乃剑杀静罹嘟鼉扇f(wàn)倍!但這并非它成功的唯一原因。
很多人關(guān)注DeepSeek的RLHF(基于人類反饋的強(qiáng)化學(xué)習(xí))或MOE(混合專家模型)等技術(shù),但在我看來(lái),DeepSeek真正的優(yōu)勢(shì)在于其卓越的“框架”。這個(gè)框架不僅大幅降低了成本,還提升了速度和質(zhì)量,真正做到了“事半功倍”。這正是西方國(guó)家對(duì)其忌憚的原因。
DeepSeek目前的輸出結(jié)果雖然不錯(cuò),但談不上驚艷。然而,憑借其極低的成本優(yōu)勢(shì),我相信,隨著時(shí)間的推移,它將超越其他競(jìng)爭(zhēng)對(duì)手。
在眾多國(guó)內(nèi)LLM中,我推薦阿里QWEN、智譜和DeepSeek這三家,它們都是我深度使用后篩選出來(lái)的優(yōu)秀選擇。
二、提示詞依然重要:認(rèn)知是關(guān)鍵
很多人誤以為DeepSeek不需要提示詞,這是錯(cuò)誤的。我一直強(qiáng)調(diào),AI的本質(zhì)是工具。不會(huì)使用工具的人,即使擁有最好的工具,也無(wú)法發(fā)揮其最大效用。
DeepSeek基于強(qiáng)化學(xué)習(xí),能夠列舉更多可能性,但這并不意味著它能替代你的認(rèn)知。你仍然需要判斷,需要清晰地表達(dá)你的需求,因?yàn)槟P捅旧聿⒉恢滥阆胍裁础?/p>
我更傾向于將提示詞分為“推理模型”和“非推理模型”兩類,并根據(jù)不同的模型類型采用不同的提示詞技巧。ChatGPT的成功之處在于其推理能力,它能夠在沒(méi)有明確提示詞的情況下分析用戶的意圖。但這對(duì)于掌握提示詞技巧的用戶來(lái)說(shuō),只是多打字和少打字的區(qū)別而已。
掌握提示詞技巧意味著你對(duì)任務(wù)有清晰的認(rèn)知,知道如何處理。一個(gè)有效的結(jié)構(gòu)化提示詞通常包含以下元素:角色設(shè)定、目標(biāo)設(shè)定、規(guī)則設(shè)定和工作流程。
推理模型的核心在于對(duì)自身認(rèn)知和規(guī)則的反思。它與結(jié)構(gòu)化提示詞的核心思想一致,只是它自動(dòng)完成了這個(gè)過(guò)程。但需要注意的是,推理模型的輸出并不總是最佳或正確的,因?yàn)樗匀皇窃谄洮F(xiàn)有數(shù)據(jù)的基礎(chǔ)上進(jìn)行預(yù)測(cè)。
我的經(jīng)驗(yàn)是,模型本身并沒(méi)有變化,但隨著我的專業(yè)知識(shí)的提升,我對(duì)模型輸出的評(píng)價(jià)也發(fā)生了變化。這說(shuō)明,AI能否用好,取決于你自身的認(rèn)知水平。AI目前并不會(huì)創(chuàng)造,只會(huì)基于數(shù)據(jù)進(jìn)行縫合。
為了更好地引導(dǎo)LLM進(jìn)行推理,可以使用以下通用公式:我要什么?給誰(shuí)用?希望達(dá)到什么樣的目標(biāo)?有沒(méi)有工作順序?有沒(méi)有忌諱?講人話。
三、本地部署與API接入
對(duì)于本地部署,我推薦Dify和Ollama這兩個(gè)工具。Dify是一個(gè)開(kāi)源的LLMOPS平臺(tái),支持本地部署,并保證數(shù)據(jù)隱私;Ollama則是一款方便易用的開(kāi)源模型本地部署軟件。
在Ollama中,你可以下載DeepSeek的模型(推薦7B或8B版本),并根據(jù)提示進(jìn)行使用。但需要注意的是,這只是為了嘗鮮,想要體驗(yàn)DeepSeek的全部性能,還需要借助其他途徑,比如接下來(lái)要介紹的Siliconflow。
目前,除了DeepSeek官網(wǎng)(經(jīng)常崩潰),Siliconflow提供了國(guó)內(nèi)唯一的DeepSeek滿血版(包括最大的671B版本)。Siliconflow作為一個(gè)基礎(chǔ)設(shè)施團(tuán)隊(duì),致力于提供高效的AI應(yīng)用服務(wù),它具有以下優(yōu)勢(shì):無(wú)需自建服務(wù)、高性能模型API、速度優(yōu)化和多廠家API統(tǒng)一接入。
雖然目前Dify還不支持Siliconflow的API,但其他一些客戶端應(yīng)用、代碼生成工具和開(kāi)發(fā)平臺(tái)等都已支持,你可以嘗試接入Siliconflow的API來(lái)體驗(yàn)DeepSeek的滿血性能。
Siliconflow基于華為云昇騰云服務(wù),提供了DeepSeek-R1和DeepSeek-V3模型推理服務(wù),在國(guó)產(chǎn)芯片的加持下,性能表現(xiàn)出色。
希望以上內(nèi)容能夠幫助大家更好地了解和使用DeepSeek。感謝閱讀!
聯(lián)系作者
文章來(lái)源:金子的知識(shí)星球
作者微信:
作者簡(jiǎn)介:AIGC研究者,游戲制作人。深耕音舞賽道10余年,負(fù)責(zé)網(wǎng)易《勁舞時(shí)代》、《AU Beat》、其他地區(qū)的《Party Masters》等多個(gè)產(chǎn)品。 在文案、流程圖、腦圖、2D繪畫(huà)、LOGO設(shè)計(jì)等多方面,驗(yàn)證了AI的使用價(jià)值。