F5-TTS,基於 Flow Matching 的零樣本語音克隆,只需 5 秒參考音頻,生成速度快,支援多語言,HF 月下載 87.3 萬次。
適合進階用戶,支援 CPU 和 GPU 混合推理,可精確控制量化等級。
# Download GGUF model from Hugging Face, then run: ./llama-cli -m model.gguf -p "Hello" -n 128
分享你的使用體驗,幫助其他人了解這個模型