AI订阅指南

未

来源：AI 订阅指南

GGUF 是 llama.cpp 使用的模型量化格式，让大模型能在普通电脑上运行。

量化级别对比：

级别	位宽	70B 模型大小	质量损失
Q8_0	8-bit	~70GB	极小
Q5_K_M	5-bit	~48GB	很小
Q4_K_M	4-bit	~40GB	小
Q3_K_S	3-bit	~32GB	明显

推荐：日常使用 Q4_K_M，质量与大小平衡最好。

转换工具：使用 llama.cpp/quantize 命令行工具。

更多本地部署教程请关注 AI 订阅指南。

未

来源：AI 订阅指南

两大 API 提供商的成本对比。

同等模型价格对比：

定位	OpenAI	Anthropic	差价
旗舰	GPT-5.5 ($10/$40)	Opus 4.7 ($15/$75)	Claude 贵 50-87%
标准	GPT-5 ($3/$12)	Sonnet 4 ($3/$15)	Output Claude 贵 25%
轻量	GPT-5-mini ($0.15/$0.60)	Haiku 3.5 ($0.25/$1.25)	Claude 贵 66-108%

结论：OpenAI API 整体更便宜，但 Claude 在编程和长文本任务上效果更好。

最佳策略：日常用 GPT-5-mini，复杂任务用 Claude Sonnet/Opus。

更多价格对比请关注 AI 订阅指南。

充值，加版主微信：QuanZhanXC

未眠拾光