SD 3.5 Medium,2.5B 參數,平衡品質與效率,8 GB VRAM 可運行,適合消費級 GPU 部署,HF 月下載 154 萬次。
適合進階用戶,支援 CPU 和 GPU 混合推理,可精確控制量化等級。
# Download GGUF model from Hugging Face, then run: ./llama-cli -m model.gguf -p "Hello" -n 128
分享你的使用體驗,幫助其他人了解這個模型