Ollama 本地部署指南:在笔记本上运行 Llama 4
-
来源:AI 订阅指南
Ollama 是目前最简单的本地 LLM 部署工具。
安装(一行命令):
curl -fsSL https://ollama.com/install.sh | sh运行模型:
ollama run llama4:8b # 8B 版本,需 8GB RAM ollama run llama4:70b # 70B 版本,需 48GB RAM硬件需求:
- 8B 模型:8GB RAM(MacBook Air M2 即可)
- 70B 模型:48GB+ RAM 或 24GB VRAM GPU
- 405B 模型:需要多 GPU 集群
性能:M2 MacBook Air 跑 8B 约 30 tokens/s。
更多本地部署教程请关注 AI 订阅指南。
-
ChromaDB 在小数据量下够用,数据量大了建议换 Milvus。