RAG 进阶:混合检索(Hybrid Search)提升准确率 40%
-
来源:AI 订阅指南
纯向量检索有时不够,混合检索能显著提升效果。
什么是混合检索?
结合关键词检索(BM25)和向量检索,取两者之长。实现方式:
from langchain.retrievers import EnsembleRetriever # BM25 检索器(关键词) bm25 = BM25Retriever.from_documents(docs) # 向量检索器 vector = db.as_retriever() # 混合检索 ensemble = EnsembleRetriever( retrievers=[bm25, vector], weights=[0.3, 0.7] # BM25 30%,向量 70% )效果:
- 纯向量检索:准确率 ~70%
- 混合检索:准确率 ~85%
适合场景:专业术语多的领域(医疗、法律、技术文档)。
更多 RAG 教程请关注 AI 订阅指南。