DeepSeek怎么用？怎么本地部署？老金手把手教你！

加我進AI討論學習群，公眾號右下角“聯系方式”\x0d\x0a\x0d\x0a關注發送“知識精華”，可獲得免費的知識鏈接地址

原標題：DeepSeek怎么用？怎么本地部署？老金手把手教你！
文章來源：金子的知識星球
內容字數：7439字

新年好！年前忙碌，年后終于可以和大家聊聊最近大火的DeepSeek了。它以低廉的價格和強大的性能，迅速成為AI領域的一匹黑馬，被譽為“價格屠夫”。本文將從DeepSeek的優勢、使用方法以及本地部署等方面進行詳細解讀。

DeepSeek最初讓我印象深刻的是它的價格，相較于國外動輒上千億美元訓練的模型，它僅需500多萬就能達到相當的水平，成本差距近兩萬倍！但這并非它成功的唯一原因。

很多人關注DeepSeek的RLHF（基于人類反饋的強化學習）或MOE（混合專家模型）等技術，但在我看來，DeepSeek真正的優勢在于其卓越的“框架”。這個框架不僅大幅降低了成本，還提升了速度和質量，真正做到了“事半功倍”。這正是西方國家對其忌憚的原因。

DeepSeek目前的輸出結果雖然不錯，但談不上驚艷。然而，憑借其極低的成本優勢，我相信，隨著時間的推移，它將超越其他競爭對手。

在眾多國內LLM中，我推薦阿里QWEN、智譜和DeepSeek這三家，它們都是我深度使用后篩選出來的優秀選擇。

很多人誤以為DeepSeek不需要提示詞，這是錯誤的。我一直強調，AI的本質是工具。不會使用工具的人，即使擁有最好的工具，也無法發揮其最大效用。

DeepSeek基于強化學習，能夠列舉更多可能性，但這并不意味著它能替代你的認知。你仍然需要判斷，需要清晰地表達你的需求，因為模型本身并不知道你想要什么。

我更傾向于將提示詞分為“推理模型”和“非推理模型”兩類，并根據不同的模型類型采用不同的提示詞技巧。ChatGPT的成功之處在于其推理能力，它能夠在沒有明確提示詞的情況下分析用戶的意圖。但這對于掌握提示詞技巧的用戶來說，只是多打字和少打字的區別而已。

掌握提示詞技巧意味著你對任務有清晰的認知，知道如何處理。一個有效的結構化提示詞通常包含以下元素：角色設定、目標設定、規則設定和工作流程。

推理模型的核心在于對自身認知和規則的反思。它與結構化提示詞的核心思想一致，只是它自動完成了這個過程。但需要注意的是，推理模型的輸出并不總是最佳或正確的，因為它仍然是在其現有數據的基礎上進行預測。

我的經驗是，模型本身并沒有變化，但隨著我的專業知識的提升，我對模型輸出的評價也發生了變化。這說明，AI能否用好，取決于你自身的認知水平。AI目前并不會創造，只會基于數據進行縫合。

為了更好地引導LLM進行推理，可以使用以下通用公式：我要什么？給誰用？希望達到什么樣的目標？有沒有工作順序？有沒有忌諱？講人話。

對于本地部署，我推薦Dify和Ollama這兩個工具。Dify是一個開源的LLMOPS平臺，支持本地部署，并保證數據隱私；Ollama則是一款方便易用的開源模型本地部署軟件。

在Ollama中，你可以下載DeepSeek的模型（推薦7B或8B版本），并根據提示進行使用。但需要注意的是，這只是為了嘗鮮，想要體驗DeepSeek的全部性能，還需要借助其他途徑，比如接下來要介紹的Siliconflow。

目前，除了DeepSeek官網（經常崩潰），Siliconflow提供了國內唯一的DeepSeek滿血版（包括最大的671B版本）。Siliconflow作為一個基礎設施團隊，致力于提供高效的AI應用服務，它具有以下優勢：無需自建服務、高性能模型API、速度優化和多廠家API統一接入。

雖然目前Dify還不支持Siliconflow的API，但其他一些客戶端應用、代碼生成工具和開發平臺等都已支持，你可以嘗試接入Siliconflow的API來體驗DeepSeek的滿血性能。

Siliconflow基于華為云昇騰云服務，提供了DeepSeek-R1和DeepSeek-V3模型推理服務，在國產芯片的加持下，性能表現出色。

希望以上內容能夠幫助大家更好地了解和使用DeepSeek。感謝閱讀！

文章來源：金子的知識星球
作者微信：
作者簡介：AIGC研究者，游戲制作人。深耕音舞賽道10余年，負責網易《勁舞時代》、《AU Beat》、其他地區的《Party Masters》等多個產品。在文案、流程圖、腦圖、2D繪畫、LOGO設計等多方面，驗證了AI的使用價值。

文章版權歸作者所有，未經允許請勿轉載。

暫無評論...