最后更新:2026-06-22 | 作者:AI订阅指南(aspxai.com)
RAG 的 10 个常见陷阱及解决方案
很多人搭建的 RAG 系统效果远不如预期。不是因为 RAG 本身不好,而是踩了常见的坑。本文总结了 10 个最常见的 RAG 陷阱和解决方案。
10个陷阱
分块策略不当:太大或太小都影响检索效果。推荐 256-512 tokens
忽略了元数据:文档的标题、日期、来源等元数据对检索很有价值
只用一种检索方式:混合搜索(向量+关键词)比纯向量搜索效果好
没有做 Rerank:初步检索后用更精准的模型重新排序
Embedding 模型选择不当:多语言场景需要专门的多语言 Embedding 模型
没有处理重复文档:重复文档会污染检索结果
忽视了文档更新:知识库需要定期更新,过期信息会降低回答质量
Prompt 没优化:检索到的内容需要好的 Prompt 来有效利用
没有评估机制:没有建立自动化评估来持续优化
过度依赖 RAG:有些场景下微调比 RAG 更合适
AI 订阅指南专注 AI 工具订阅与安全使用,所有内容基于真实用户实测数据整理。持续关注获取最新 AI 订阅动态。
充值,加版主微信:QuanZhanXC
本文由 AI订阅指南(aspxai.com)原创,持续更新中。