🎤️ 語音處理MIT

VibeVoice-1.5B

Microsoft VibeVoice-1.5B,MIT 授權,支援情感和風格控制的高品質 TTS,HF 月下載 21.8 萬次,8 GB VRAM 可運行。

資料更新:2026年3月25日

VRAM 計算器

我的 GPU VRAM:
量化等級
Q4_K_M
1.3 GB

部署指南

方法二:llama.cpp

適合進階用戶,支援 CPU 和 GPU 混合推理,可精確控制量化等級。

# Download GGUF model from Hugging Face, then run:
./llama-cli -m model.gguf -p "Hello" -n 128

規格

參數量1.5B
最大上下文
HF 下載量152K/月

模型強項

情感語音合成多說話人支援長音頻生成低資源高效對話流理解

推薦用途

  • 製作包含多個說話者且具備情感表達的長篇有聲書或Podcast內容。
  • 開發能生成自然對話、具備語氣變化的AI客服或虛擬助理應用。
  • 在資源有限的環境下,高效生成高品質且具情感控制的語音內容。

標籤

語音合成MIT情感控制

部署工具

TransformersPython

使用心得

分享你的使用體驗,幫助其他人了解這個模型

0/1000
還沒有評論,成為第一個分享心得的人!