moondream2 是最輕量的視覺語言模型之一,1.86B 參數,可在 CPU 或 2 GB VRAM 內運行,適合邊緣設備的圖像理解任務。
安裝 Ollama 後直接執行,自動下載並運行模型。
ollama run moondream:latest
適合進階用戶,支援 CPU 和 GPU 混合推理,可精確控制量化等級。
# Download GGUF model from Hugging Face, then run: ./llama-cli -m model.gguf -p "Hello" -n 128
ollama run moondream:latestmoondream2 是一個開源多模態,擁有 1.86B 參數,採用 Apache 2.0 授權。可使用 llama.cpp、Ollama 進行部署。適用場景包括:在嵌入式設備或低配置硬體上進行即時圖像內容分析與描述、開發需要快速圖像識別與文字輸出的行動應用程式或物聯網裝置。核心優勢:輕量高效、視覺理解、邊緣部署、低VRAM需求。 可在本地硬體上自行部署,完全保護隱私,無需 API 金鑰。
分享你的使用體驗,幫助其他人了解這個模型