加我進AI討論學習群,公眾號右下角“聯系方式”\x0d\x0a\x0d\x0a關注發送“知識精華”,可獲得免費的知識鏈接地址
原標題:DeepSeek怎么用?怎么本地部署?老金手把手教你!
文章來源:金子的知識星球
內容字數:7439字
DeepSeek:價格屠夫與框架王者
新年好!年前忙碌,年后終于可以和大家聊聊最近大火的DeepSeek了。它以低廉的價格和強大的性能,迅速成為AI領域的一匹黑馬,被譽為“價格屠夫”。本文將從DeepSeek的優勢、使用方法以及本地部署等方面進行詳細解讀。
一、DeepSeek的獨特之處:框架為王
DeepSeek最初讓我印象深刻的是它的價格,相較于國外動輒上千億美元訓練的模型,它僅需500多萬就能達到相當的水平,成本差距近兩萬倍!但這并非它成功的唯一原因。
很多人關注DeepSeek的RLHF(基于人類反饋的強化學習)或MOE(混合專家模型)等技術,但在我看來,DeepSeek真正的優勢在于其卓越的“框架”。這個框架不僅大幅降低了成本,還提升了速度和質量,真正做到了“事半功倍”。這正是西方國家對其忌憚的原因。
DeepSeek目前的輸出結果雖然不錯,但談不上驚艷。然而,憑借其極低的成本優勢,我相信,隨著時間的推移,它將超越其他競爭對手。
在眾多國內LLM中,我推薦阿里QWEN、智譜和DeepSeek這三家,它們都是我深度使用后篩選出來的優秀選擇。
二、提示詞依然重要:認知是關鍵
很多人誤以為DeepSeek不需要提示詞,這是錯誤的。我一直強調,AI的本質是工具。不會使用工具的人,即使擁有最好的工具,也無法發揮其最大效用。
DeepSeek基于強化學習,能夠列舉更多可能性,但這并不意味著它能替代你的認知。你仍然需要判斷,需要清晰地表達你的需求,因為模型本身并不知道你想要什么。
我更傾向于將提示詞分為“推理模型”和“非推理模型”兩類,并根據不同的模型類型采用不同的提示詞技巧。ChatGPT的成功之處在于其推理能力,它能夠在沒有明確提示詞的情況下分析用戶的意圖。但這對于掌握提示詞技巧的用戶來說,只是多打字和少打字的區別而已。
掌握提示詞技巧意味著你對任務有清晰的認知,知道如何處理。一個有效的結構化提示詞通常包含以下元素:角色設定、目標設定、規則設定和工作流程。
推理模型的核心在于對自身認知和規則的反思。它與結構化提示詞的核心思想一致,只是它自動完成了這個過程。但需要注意的是,推理模型的輸出并不總是最佳或正確的,因為它仍然是在其現有數據的基礎上進行預測。
我的經驗是,模型本身并沒有變化,但隨著我的專業知識的提升,我對模型輸出的評價也發生了變化。這說明,AI能否用好,取決于你自身的認知水平。AI目前并不會創造,只會基于數據進行縫合。
為了更好地引導LLM進行推理,可以使用以下通用公式:我要什么?給誰用?希望達到什么樣的目標?有沒有工作順序?有沒有忌諱?講人話。
三、本地部署與API接入
對于本地部署,我推薦Dify和Ollama這兩個工具。Dify是一個開源的LLMOPS平臺,支持本地部署,并保證數據隱私;Ollama則是一款方便易用的開源模型本地部署軟件。
在Ollama中,你可以下載DeepSeek的模型(推薦7B或8B版本),并根據提示進行使用。但需要注意的是,這只是為了嘗鮮,想要體驗DeepSeek的全部性能,還需要借助其他途徑,比如接下來要介紹的Siliconflow。
目前,除了DeepSeek官網(經常崩潰),Siliconflow提供了國內唯一的DeepSeek滿血版(包括最大的671B版本)。Siliconflow作為一個基礎設施團隊,致力于提供高效的AI應用服務,它具有以下優勢:無需自建服務、高性能模型API、速度優化和多廠家API統一接入。
雖然目前Dify還不支持Siliconflow的API,但其他一些客戶端應用、代碼生成工具和開發平臺等都已支持,你可以嘗試接入Siliconflow的API來體驗DeepSeek的滿血性能。
Siliconflow基于華為云昇騰云服務,提供了DeepSeek-R1和DeepSeek-V3模型推理服務,在國產芯片的加持下,性能表現出色。
希望以上內容能夠幫助大家更好地了解和使用DeepSeek。感謝閱讀!
聯系作者
文章來源:金子的知識星球
作者微信:
作者簡介:AIGC研究者,游戲制作人。深耕音舞賽道10余年,負責網易《勁舞時代》、《AU Beat》、其他地區的《Party Masters》等多個產品。 在文案、流程圖、腦圖、2D繪畫、LOGO設計等多方面,驗證了AI的使用價值。