moondream2 是最輕量的視覺語言模型之一,1.86B 參數,可在 CPU 或 2 GB VRAM 內運行,適合邊緣設備的圖像理解任務。
安裝 Ollama 後直接執行,自動下載並運行模型。
ollama run moondream:latest
適合進階用戶,支援 CPU 和 GPU 混合推理,可精確控制量化等級。
# Download GGUF model from Hugging Face, then run: ./llama-cli -m model.gguf -p "Hello" -n 128
ollama run moondream:latest分享你的使用體驗,幫助其他人了解這個模型