Qwen3-TTS 1.7B,HF 月下載 108 萬次,Apache 2.0 授權,支援自訂聲音克隆,多語言 TTS,音質自然流暢,8 GB VRAM 可運行。
| 量化 | 4K | 8K | 16K | 32K | 64K | 128K |
|---|---|---|---|---|---|---|
| Q4_K_M★ | 1.1 GB | 1.3 GB | 1.7 GB | 2.5 GB | 4.1 GB | 7.3 GB |
| Q8_0 | 2.0 GB | 2.2 GB | 2.6 GB | 3.4 GB | 5.0 GB | 8.2 GB |
使用 Hugging Face Transformers pipeline 快速整合。
pip install transformers torch
python -c "
from transformers import pipeline
tts = pipeline('text-to-speech', model='https://huggingface.co/Qwen/Qwen3-TTS-12Hz-1.7B-CustomVoice')
audio = tts('Hello, world!')
# Save audio['audio'] to file"適合生產環境,支援批次推理和 OpenAI 相容 API。
pip install vllm vllm serve Qwen --dtype auto
Qwen3-TTS-1.7B 是一個開源語音處理,擁有 1.7B 參數,採用 Apache 2.0 授權。可使用 Transformers、vLLM 進行部署。適用場景包括:適用於需要多語言語音輸出的應用,如國際化客服系統或多語種有聲讀物製作。、適合在資源有限的設備上進行語音合成,例如在邊緣設備上實現即時語音播報。、可用於創建個性化語音助手或品牌專屬的語音形象,透過聲音克隆技術提升用戶體驗。。核心優勢:多語言語音合成、聲音克隆、自然流暢音質、低VRAM需求、語境理解。 可在本地硬體上自行部署,完全保護隱私,無需 API 金鑰。
分享你的使用體驗,幫助其他人了解這個模型