Dia-1.6B,Nari Labs 開源 TTS,支援多說話人對話生成,可生成笑聲、嘆氣等非語言聲音,Apache 2.0 授權,8 GB VRAM。
使用 Hugging Face Transformers pipeline 快速整合。
pip install transformers torch
python -c "
from transformers import pipeline
tts = pipeline('text-to-speech', model='https://huggingface.co/nari-labs/Dia-1.6B')
audio = tts('Hello, world!')
# Save audio['audio'] to file"Dia-1.6B 是一個開源語音處理,擁有 1.6B 參數,採用 Apache 2.0 授權。可使用 Python、Transformers 進行部署。適用場景包括:用於遊戲、動畫或虛擬助理中,生成具備情感與非語言音效的自然對話。、開發多角色語音互動應用,實現更生動、逼真的語音體驗。。核心優勢:多角色對話、非語言音效、情感語氣控制、高擬真語音。 可在本地硬體上自行部署,完全保護隱私,無需 API 金鑰。
分享你的使用體驗,幫助其他人了解這個模型