Coqui XTTS-v2,HF 月下載 680 萬次,支援 17 種語言的聲音克隆,只需 6 秒參考音頻即可複製任意聲音,CPU 可運行。
支援聲音複製的高品質 TTS。
pip install TTS
python -c "
from TTS.api import TTS
tts = TTS('https://huggingface.co/coqui/XTTS-v2').to('cuda')
tts.tts_to_file(text='Hello world', file_path='output.wav')"XTTS-v2 是一個開源語音處理,擁有 467M 參數,採用 Coqui Public Model 授權。可使用 Coqui TTS、Python 進行部署。適用場景包括:為多語言內容創作快速生成帶有特定語音風格的旁白或配音。、在資源有限的設備上,實現實時或近實時的語音克隆與合成應用。。核心優勢:多語言克隆、小樣本學習、跨語言合成、低資源運行。 可在本地硬體上自行部署,完全保護隱私,無需 API 金鑰。
分享你的使用體驗,幫助其他人了解這個模型