<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        完整的671B MoE DeepSeek R1怎么塞進本地化部署?詳盡教程大放送!

        AIGC動態3個月前發布 機器之心
        494 0 0

        能在單臺 Mac Studio 上運行!

        完整的671B MoE DeepSeek R1怎么塞進本地化部署?詳盡教程大放送!

        原標題:完整的671B MoE DeepSeek R1怎么塞進本地化部署?詳盡教程大放送!
        文章來源:機器之心
        內容字數:10445字

        DeepSeek R1 671B 模型本地部署簡明教程

        本文介紹了如何在本地部署 DeepSeek R1 671B 全量模型,并重點闡述了如何利用 Unsloth AI 提供的動態量化版本,大幅降低模型體積,從而在消費級硬件上運行。

        1. 模型選擇與壓縮

        原版 DeepSeek R1 671B 模型文件高達 720GB,難以本地部署。Unsloth AI 提供了動態量化版本,通過對關鍵層進行高質量量化,對非關鍵層進行低比特量化,將模型壓縮至 131GB-212GB。作者推薦了兩種量化版本:DeepSeek-R1-UD-IQ1_M (1.73-bit,158GB) 和 DeepSeek-R1-Q4_K_M (4-bit,404GB),用戶可根據硬件條件選擇。

        2. 硬件需求與運行環境

        部署大模型主要受限于內存和顯存。DeepSeek-R1-UD-IQ1_M 需要至少 200GB 內存+顯存,DeepSeek-R1-Q4_K_M 需要至少 500GB。作者使用四路 RTX 4090 和四通道 DDR5 內存的工作站進行測試,短文本生成速度分別為 7-8 token/秒和 2-4 token/秒。文章也列舉了更具性價比的選項,如 Mac Studio (192GB 統一內存) 或配備多張 80GB 顯存 GPU 的服務器/云服務器。

        3. 部署步驟

        本文詳細介紹了在 Linux 環境下使用 ollama 部署模型的步驟:

        1. 從 HuggingFace 下載模型的 .gguf 文件并合并。
        2. 安裝 ollama。
        3. 創建 Modelfile 文件,指定模型路徑、GPU 使用數量 (num_gpu) 和上下文窗口大小 (num_ctx) 等參數。
        4. 使用 ollama create 命令創建模型。
        5. 使用 ollama run 命令運行模型,并使用 –verbose 參數查看推理速度。
        6. (可選) 安裝 Open WebUI 建立網頁界面。

        4. 實測結果與觀察

        作者進行了初步測試,發現:

        1. 1.73-bit 和 4-bit 版本在經典任務中表現良好。
        2. 全量模型顯著優于蒸餾版模型。
        3. 4-bit 版本比 1.73-bit 版本更 “保守”,對“攻擊性”提示的回應更謹慎。
        4. 1.73-bit 版本偶爾生成格式混亂的內容。
        5. CPU 利用率極高,GPU 利用率低,說明性能瓶頸在于 CPU 和內存帶寬。

        5. 結論與建議

        作者建議在消費級硬件上使用 1.73-bit 版本進行短文本生成等輕量級任務,避免長文本和多輪對話。 文章最后鼓勵讀者在評論區分享部署經驗和問題。


        聯系作者

        文章來源:機器之心
        作者微信:
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲AV成人精品一区二区三区| 亚洲中文字幕一区精品自拍| 最好免费观看高清在线| 亚洲va无码专区国产乱码| 3d动漫精品啪啪一区二区免费| 亚洲视频在线观看不卡| 成人毛片免费视频| 乱人伦中文视频在线观看免费| 亚洲国产综合精品中文字幕| 最近更新免费中文字幕大全| 亚洲欧洲日产国码www| 亚洲AV日韩精品一区二区三区| 99精品免费视品| 美女裸体无遮挡免费视频网站| 亚洲成AV人片在线播放无码| 国产精品成人免费视频网站京东| 水蜜桃视频在线观看免费| 久久精品夜色国产亚洲av| 亚洲国产精品成人网址天堂| 中文字幕视频免费| 男女交性无遮挡免费视频| 亚洲人成色99999在线观看| 亚洲午夜久久久久久久久久 | 国产国产人免费人成免费视频 | 亚洲精品国偷自产在线| 无码中文在线二区免费| 国产在线观看免费av站| 日韩亚洲不卡在线视频中文字幕在线观看 | 日韩版码免费福利视频| 人成电影网在线观看免费| 大桥未久亚洲无av码在线| 亚洲人成在线观看| 亚洲成av人片一区二区三区| 国产精品久久免费视频| 好爽好紧好大的免费视频国产| 亚洲欧洲免费视频| 免费无码专区毛片高潮喷水| 国产成人亚洲午夜电影| 亚洲av无码片区一区二区三区| 在线亚洲精品自拍| 免费国产人做人视频在线观看|