Qwen3-TTS 1.7B,HF 月下載 108 萬次,Apache 2.0 授權,支援自訂聲音克隆,多語言 TTS,音質自然流暢,8 GB VRAM 可運行。
適合進階用戶,支援 CPU 和 GPU 混合推理,可精確控制量化等級。
# Download GGUF model from Hugging Face, then run: ./llama-cli -m model.gguf -p "Hello" -n 128
適合生產環境,支援批次推理和 OpenAI 相容 API。
pip install vllm vllm serve Qwen --dtype auto
分享你的使用體驗,幫助其他人了解這個模型