llama.cpp 是純 C/C++ 實現的 LLM 推理引擎,支援 CPU 和 GPU,GGUF 量化格式的標準,GitHub 70k+ stars,MIT 授權。
分享你的使用體驗,幫助其他人了解這個模型