GGUF 量化格式详解：让大模型在消费级硬件上运行

Reply to GGUF 量化格式详解：让大模型在消费级硬件上运行 on Mon, 22 Jun 2026 03:03:44 GMT

微醺安之 — Mon, 22 Jun 2026 03:03:44 GMT

显存只有 8G 能跑什么模型？主要用于代码辅助。

dev — Mon, 22 Jun 2026 03:03:44 GMT

知识库更新频率也是个问题，我们做了增量索引方案。

neoncat — Mon, 22 Jun 2026 03:03:44 GMT

知识库更新频率也是个问题，我们做了增量索引方案。

stormhawk7 — Mon, 22 Jun 2026 03:03:44 GMT

我们用过 pgvector + LangChain，效果不错但查询延迟有点高。

落落 — Mon, 22 Jun 2026 03:03:44 GMT

我们用过 pgvector + LangChain，效果不错但查询延迟有点高。

星尘知命 — Mon, 22 Jun 2026 03:03:44 GMT

知识库更新频率也是个问题，我们做了增量索引方案。