CogVideoX-5B,智譜 AI 開源影片生成模型,5B 參數,支援 720×480 解析度,HF 月下載 3.2 萬次,16 GB VRAM 可運行。
節點式工作流編輯器,支援 LoRA、ControlNet 和進階管線。
# 1. Install ComfyUI git clone https://github.com/comfyanonymous/ComfyUI cd ComfyUI && pip install -r requirements.txt # 2. Download model to models/checkpoints/ # 3. Run: python main.py
適合自訂管線和程式化圖像生成的 Python API。
pip install diffusers transformers accelerate
python -c "
from diffusers import StableDiffusionPipeline
pipe = StableDiffusionPipeline.from_pretrained('https://huggingface.co/zai-org/CogVideoX-5b')
pipe = pipe.to('cuda')
image = pipe('a photo of a cat').images[0]
image.save('output.png')"CogVideoX-5B 是一個開源影片生成,擁有 5B 參數,採用 CogVideoX 授權。可使用 ComfyUI、Diffusers 進行部署。適用場景包括:在資源有限的設備上,快速生成720x480解析度的影片內容、作為影音內容創作的基礎模型,進行影片原型設計與概念驗證。核心優勢:影片生成、開源模型、低VRAM需求、高解析度支援。 可在本地硬體上自行部署,完全保護隱私,無需 API 金鑰。
分享你的使用體驗,幫助其他人了解這個模型