ResembleAI Chatterbox,HF 月下載 225 萬次,MIT 授權,高品質英語 TTS 和聲音克隆,情感控制豐富,4 GB VRAM 可運行。
使用 Hugging Face Transformers pipeline 快速整合。
pip install transformers torch
python -c "
from transformers import pipeline
asr = pipeline('automatic-speech-recognition', model='https://huggingface.co/ResembleAI/chatterbox')
result = asr('audio.mp3')
print(result['text'])"Chatterbox 是一個開源語音處理,擁有 800M 參數,採用 MIT 授權。可使用 Python、Transformers 進行部署。適用場景包括:適用於需要生成多種語言且富有情感的旁白或語音內容的應用。、適合開發需要高品質語音克隆功能,例如個性化語音助理或有聲書製作。、可用於在資源有限的設備上,實現高效的文本轉語音功能,如移動應用。。核心優勢:高品質語音合成、多語言支援、情感豐富控制、聲音克隆、低VRAM需求。 可在本地硬體上自行部署,完全保護隱私,無需 API 金鑰。
分享你的使用體驗,幫助其他人了解這個模型