RAG 架构入门——一张图讲清「检索增强」到底在干嘛
-
RAG 这个词听起来复杂,其实可以先理解成一句话:让模型回答前,先从你的资料里找相关内容,再带着这些内容回答。
一个最小 RAG 流程大概是:
上传文档 → 切分成小块 → 做向量化 → 用户提问 → 检索相关片段 → 交给模型生成答案
它解决的不是“让模型变聪明”,而是让模型有机会基于你的私有资料回答。比如公司制度、产品文档、客服知识库、项目手册,都适合尝试。
但 RAG 也不是万能。文档质量差、切分乱、检索不准、权限没管好,都会让结果变差。
我建议新手先做一个很小的版本:只放 20 篇文档,只支持问答,不做复杂权限,不做多轮记忆。先看检索出来的片段对不对。检索不对,后面生成再漂亮也没用。
RAG 的第一优先级不是模型,而是资料整理和检索质量。这个顺序别反。
-
RAG 这个词听起来复杂,其实可以先理解成一句话:让模型回答前,先从你的资料里找相关内容,再带着这些内容回答。
一个最小 RAG 流程大概是:
上传文档 → 切分成小块 → 做向量化 → 用户提问 → 检索相关片段 → 交给模型生成答案
它解决的不是“让模型变聪明”,而是让模型有机会基于你的私有资料回答。比如公司制度、产品文档、客服知识库、项目手册,都适合尝试。
但 RAG 也不是万能。文档质量差、切分乱、检索不准、权限没管好,都会让结果变差。
我建议新手先做一个很小的版本:只放 20 篇文档,只支持问答,不做复杂权限,不做多轮记忆。先看检索出来的片段对不对。检索不对,后面生成再漂亮也没用。
RAG 的第一优先级不是模型,而是资料整理和检索质量。这个顺序别反。