🎤️ 語音處理MIT

Whisper large-v3

OpenAI Whisper large-v3,HF 月下載 1820 萬次,業界最準確的開源語音辨識模型,支援 99 種語言,MIT 授權。

資料更新:2026年3月25日

VRAM 計算器

我的 GPU VRAM:
量化等級
Q4_K_M
1.4 GB

部署指南

方法一:Ollama(最簡單)

安裝 Ollama 後直接執行,自動下載並運行模型。

ollama run whisper:large-v3

方法二:llama.cpp

適合進階用戶,支援 CPU 和 GPU 混合推理,可精確控制量化等級。

# Download GGUF model from Hugging Face, then run:
./llama-cli -m model.gguf -p "Hello" -n 128
ollama run whisper:large-v3

規格

參數量1.54B
最大上下文
HF 下載量5.0M/月

模型強項

業界最佳語音辨識多語言支援高準確度開源免費

推薦用途

  • 適用於需要高準確度語音轉文字的應用,如會議記錄、語音助手。
  • 適合開發多語言語音辨識系統,支援全球用戶的語音輸入處理。
  • 可用於音訊內容的自動字幕生成,提升影片或廣播的可訪問性。

標籤

HF 熱門語音辨識MIT推薦多語言

部署工具

faster-whisperwhisper.cppOllama

使用心得

分享你的使用體驗,幫助其他人了解這個模型

0/1000
還沒有評論,成為第一個分享心得的人!