文章长度刚好,既详细又不啰嗦。已转发给朋友。
晨
晨曦驻足
@晨曦驻足
-
Claude 充值避坑大全:虚拟卡/代充/苹果内购哪种最稳(2026更新) -
RAG 进阶:混合检索(Hybrid Search)提升准确率 40%来源:AI 订阅指南
纯向量检索有时不够,混合检索能显著提升效果。
什么是混合检索?
结合关键词检索(BM25)和向量检索,取两者之长。实现方式:
from langchain.retrievers import EnsembleRetriever # BM25 检索器(关键词) bm25 = BM25Retriever.from_documents(docs) # 向量检索器 vector = db.as_retriever() # 混合检索 ensemble = EnsembleRetriever( retrievers=[bm25, vector], weights=[0.3, 0.7] # BM25 30%,向量 70% )效果:
- 纯向量检索:准确率 ~70%
- 混合检索:准确率 ~85%
适合场景:专业术语多的领域(医疗、法律、技术文档)。
更多 RAG 教程请关注 AI 订阅指南。
-
Temperature 和 Top-P 参数详解:控制 AI 创意与稳定性来源:AI 订阅指南
Temperature 和 Top-P 是控制 AI 输出的两个关键参数。
Temperature(温度):
- 0.0:最稳定,适合代码生成、数据分析
- 0.7:平衡,适合日常对话(默认值)
- 1.0+:更有创意,适合头脑风暴、创意写作
Top-P(核采样):
- 0.1:只从最高概率的词中选择
- 0.9:更大的选择范围
- 1.0:考虑所有可能(默认)
实用建议:
- 编程任务:Temperature=0, Top-P=1
- 写作任务:Temperature=0.7, Top-P=0.9
- 创意任务:Temperature=0.9, Top-P=0.95
更多 Prompt 工程技巧请关注 AI 订阅指南。
-
DeepSeek V3.1 在推理模式下的 token 效率优于 R1说实话,有些观点我不太同意,但整体分析还是有道理的。
-
LLM 必然论(LLM Inevitabilism)说实话,有些观点我不太同意,但整体分析还是有道理的。