🧠 語言模型MoEmit

Deepseek V4 Flash Max

Deepseek V4 Flash Max 由 deepseek-ai 開發的開源 語言 模型。授權:mit。共 1 個尺寸版本。

📅 發布:2026-04資料更新:2026年5月1日

VRAM 計算器

我的 GPU VRAM:
量化等級
上下文長度
Q4_K_M · 8K context
模型權重 + KV Cache + 0.5 GB overhead
157 GB
完整 VRAM 對照表(所有量化 × 上下文)
量化4K8K16K32K64K128K
Q4_K_M157 GB157 GB159 GB161 GB166 GB175 GB
Q8_0299 GB299 GB301 GB303 GB308 GB317 GB

規格

參數量284B (A28.4B)
最大上下文1.024M tokens

標籤

deepseek-aimitllmDeepseek V4 Flash Max

部署工具

ollamallama.cpp

關於 Deepseek V4 Flash Max — 開源 AI 模型

Deepseek V4 Flash Max 是一個開源語言模型,擁有 284B (A28.4B) 參數,採用 mit 授權。可使用 ollama、llama.cpp 進行部署。 可在本地硬體上自行部署,完全保護隱私,無需 API 金鑰。

使用心得

分享你的使用體驗,幫助其他人了解這個模型

0/1000
還沒有評論,成為第一個分享心得的人!