🎤️ 語音處理MIT

Chatterbox

ResembleAI Chatterbox,HF 月下載 225 萬次,MIT 授權,高品質英語 TTS 和聲音克隆,情感控制豐富,4 GB VRAM 可運行。

📅 發布:2025-04資料更新:2026年5月11日

VRAM 計算器

我的 GPU VRAM:
量化等級
Q4_K_M · 8K context
模型權重 + KV Cache + 0.5 GB overhead

部署指南

方法:Transformers(Python)

使用 Hugging Face Transformers pipeline 快速整合。

pip install transformers torch
python -c "
from transformers import pipeline
asr = pipeline('automatic-speech-recognition', model='https://huggingface.co/ResembleAI/chatterbox')
result = asr('audio.mp3')
print(result['text'])"

規格

參數量800M
最大上下文
HF 下載量2.3M/月

模型強項

高品質語音合成多語言支援情感豐富控制聲音克隆低VRAM需求

推薦用途

  • 適用於需要生成多種語言且富有情感的旁白或語音內容的應用。
  • 適合開發需要高品質語音克隆功能,例如個性化語音助理或有聲書製作。
  • 可用於在資源有限的設備上,實現高效的文本轉語音功能,如移動應用。

標籤

HF 熱門語音合成MIT聲音克隆

部署工具

PythonTransformers

關於 Chatterbox — 開源 AI 模型

Chatterbox 是一個開源語音處理,擁有 800M 參數,採用 MIT 授權。可使用 Python、Transformers 進行部署。適用場景包括:適用於需要生成多種語言且富有情感的旁白或語音內容的應用。、適合開發需要高品質語音克隆功能,例如個性化語音助理或有聲書製作。、可用於在資源有限的設備上,實現高效的文本轉語音功能,如移動應用。。核心優勢:高品質語音合成、多語言支援、情感豐富控制、聲音克隆、低VRAM需求。 可在本地硬體上自行部署,完全保護隱私,無需 API 金鑰。

使用心得

分享你的使用體驗,幫助其他人了解這個模型

0/1000
還沒有評論,成為第一個分享心得的人!