💻 程式碼MoEDeepSeek

DeepSeek-Coder-V2

DeepSeek Coder V2，236B MoE 模型（激活 21B），程式碼生成能力超越 GPT-4 Turbo，支援 128K 上下文，需要多 GPU。

↻資料更新：2026年3月25日

VRAM 計算器

我的 GPU VRAM：

量化等級

上下文長度

Q4_K_M · 8K context

模型權重 + KV Cache + 0.5 GB overhead

139.2 GB

完整 VRAM 對照表（所有量化 × 上下文）

適合進階用戶，支援 CPU 和 GPU 混合推理，可精確控制量化等級。

# Download GGUF model from Hugging Face, then run:
./llama-cli -m model.gguf -p "Hello" -n 128

適合生產環境，支援批次推理和 OpenAI 相容 API。

pip install vllm
vllm serve DeepSeek --dtype auto

參數量236B (A21B)

最大上下文128K tokens

HF 下載量8K/月

頂級程式碼能力超長上下文MoE 高效能超越 GPT-4 Turbo

vLLMSGLang

分享你的使用體驗，幫助其他人了解這個模型

0/1000

還沒有評論，成為第一個分享心得的人！