RAG 架构入门——一张图讲清「检索增强」到底在干嘛

荷塘惜别

RAG 这个词听起来复杂，其实可以先理解成一句话：让模型回答前，先从你的资料里找相关内容，再带着这些内容回答。

一个最小 RAG 流程大概是：

上传文档 → 切分成小块 → 做向量化 → 用户提问 → 检索相关片段 → 交给模型生成答案

它解决的不是“让模型变聪明”，而是让模型有机会基于你的私有资料回答。比如公司制度、产品文档、客服知识库、项目手册，都适合尝试。

但 RAG 也不是万能。文档质量差、切分乱、检索不准、权限没管好，都会让结果变差。

我建议新手先做一个很小的版本：只放 20 篇文档，只支持问答，不做复杂权限，不做多轮记忆。先看检索出来的片段对不对。检索不对，后面生成再漂亮也没用。

RAG 的第一优先级不是模型，而是资料整理和检索质量。这个顺序别反。

荷塘惜别

RAG 这个词听起来复杂，其实可以先理解成一句话：让模型回答前，先从你的资料里找相关内容，再带着这些内容回答。

一个最小 RAG 流程大概是：

上传文档 → 切分成小块 → 做向量化 → 用户提问 → 检索相关片段 → 交给模型生成答案

它解决的不是“让模型变聪明”，而是让模型有机会基于你的私有资料回答。比如公司制度、产品文档、客服知识库、项目手册，都适合尝试。

但 RAG 也不是万能。文档质量差、切分乱、检索不准、权限没管好，都会让结果变差。

我建议新手先做一个很小的版本：只放 20 篇文档，只支持问答，不做复杂权限，不做多轮记忆。先看检索出来的片段对不对。检索不对，后面生成再漂亮也没用。

RAG 的第一优先级不是模型，而是资料整理和检索质量。这个顺序别反。

wolfsong46

知识库更新频率也是个问题，我们做了增量索引方案。

未眠闲情

我们用过 pgvector + LangChain，效果不错但查询延迟有点高。

omegadreamer

分块策略对最终效果影响巨大，别小看这一步。

荷塘三世

知识库更新频率也是个问题，我们做了增量索引方案。

AI订阅指南