🎦 影片生成CogVideoX

CogVideoX-5B

CogVideoX-5B,智譜 AI 開源影片生成模型,5B 參數,支援 720×480 解析度,HF 月下載 3.2 萬次,16 GB VRAM 可運行。

📅 發布:2024-08資料更新:2026年5月11日

VRAM 計算器

我的 GPU VRAM:
量化等級
Q4_K_M · 8K context
模型權重 + KV Cache + 0.5 GB overhead

部署指南

方法:ComfyUI

節點式工作流編輯器,支援 LoRA、ControlNet 和進階管線。

# 1. Install ComfyUI
git clone https://github.com/comfyanonymous/ComfyUI
cd ComfyUI && pip install -r requirements.txt

# 2. Download model to models/checkpoints/
# 3. Run: python main.py

方法:Diffusers(Python)

適合自訂管線和程式化圖像生成的 Python API。

pip install diffusers transformers accelerate
python -c "
from diffusers import StableDiffusionPipeline
pipe = StableDiffusionPipeline.from_pretrained('https://huggingface.co/zai-org/CogVideoX-5b')
pipe = pipe.to('cuda')
image = pipe('a photo of a cat').images[0]
image.save('output.png')"

規格

參數量5B
最大上下文
HF 下載量37K/月

模型強項

影片生成開源模型低VRAM需求高解析度支援

推薦用途

  • 在資源有限的設備上,快速生成720x480解析度的影片內容
  • 作為影音內容創作的基礎模型,進行影片原型設計與概念驗證

標籤

影片生成推薦

部署工具

ComfyUIDiffusers

關於 CogVideoX-5B — 開源 AI 模型

CogVideoX-5B 是一個開源影片生成,擁有 5B 參數,採用 CogVideoX 授權。可使用 ComfyUI、Diffusers 進行部署。適用場景包括:在資源有限的設備上,快速生成720x480解析度的影片內容、作為影音內容創作的基礎模型,進行影片原型設計與概念驗證。核心優勢:影片生成、開源模型、低VRAM需求、高解析度支援。 可在本地硬體上自行部署,完全保護隱私,無需 API 金鑰。

使用心得

分享你的使用體驗,幫助其他人了解這個模型

0/1000
還沒有評論,成為第一個分享心得的人!