🎤️ 語音處理Apache 2.0

Dia-1.6B

Dia-1.6B,Nari Labs 開源 TTS,支援多說話人對話生成,可生成笑聲、嘆氣等非語言聲音,Apache 2.0 授權,8 GB VRAM。

資料更新:2026年3月25日

VRAM 計算器

我的 GPU VRAM:
量化等級
Q4_K_M
1.4 GB

部署指南

方法二:llama.cpp

適合進階用戶,支援 CPU 和 GPU 混合推理,可精確控制量化等級。

# Download GGUF model from Hugging Face, then run:
./llama-cli -m model.gguf -p "Hello" -n 128

規格

參數量1.6B
最大上下文
HF 下載量110K/月

模型強項

多角色對話非語言音效情感語氣控制高擬真語音

推薦用途

  • 用於遊戲、動畫或虛擬助理中,生成具備情感與非語言音效的自然對話。
  • 開發多角色語音互動應用,實現更生動、逼真的語音體驗。

標籤

語音合成Apache 2.0對話式

部署工具

PythonTransformers

使用心得

分享你的使用體驗,幫助其他人了解這個模型

0/1000
還沒有評論,成為第一個分享心得的人!