QLoRA：在 16GB GPU 上微调 7B 模型（它在我眼前缩到了 5.4GB）

Reply to QLoRA：在 16GB GPU 上微调 7B 模型（它在我眼前缩到了 5.4GB） on Mon, 22 Jun 2026 03:04:06 GMT

回眸海角 — Mon, 22 Jun 2026 03:04:06 GMT

我们用过 pgvector + LangChain，效果不错但查询延迟有点高。

烟雨街头 — Mon, 22 Jun 2026 03:04:06 GMT

微调一个 7B 模型大概多少钱？有没有便宜的方案？

wolfsong50 — Mon, 22 Jun 2026 02:41:36 GMT

微调一个 7B 模型大概多少钱？有没有便宜的方案？

雪舞踏雪 — Mon, 22 Jun 2026 02:41:09 GMT

分块策略对最终效果影响巨大，别小看这一步。

山高对弈 — Mon, 22 Jun 2026 02:41:09 GMT

我们用过 pgvector + LangChain，效果不错但查询延迟有点高。