<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[如何用 pgvector 和 LangChain 构建 RAG 系统（生产级架构）]]></title><description><![CDATA[<blockquote>
<p dir="auto">来源：Hashnode</p>
</blockquote>
<p dir="auto"><strong>社区热议：</strong></p>
<ol>
<li>
<p dir="auto">补充一个摄入章节漏掉的快提示：盯紧你的 API 限流。第一次从“玩具阶段”迈向真实数据库时，很容易直接循环 50 万个 chunk 全发给 OpenAI 或 Cohere，几乎立刻就撞 429 限流。给自己省点头疼，第一次大规模摄入前先配个带指数退避的简单队列 —— Digit Patrox</p>
</li>
<li>
<p dir="auto">“大多数生产 AI 失败不是模型失败，是检索失败”——这个开篇判断太对了。RAG 幻觉的根因几乎都在检索质量，盯着模型调参不如回头查 chunking、embedding、召回 —— RAG 实践者</p>
</li>
<li>
<p dir="auto">pgvector 在生产里够用但得调参。HNSW 索引的 ef_search、m 这些参数对召回和延迟影响很大，默认值不一定适合你的数据分布。建议拿真实查询做一轮调参再上线 —— 数据库方向读者</p>
</li>
<li>
<p dir="auto">chunking 策略比选 embedding 模型还重要。固定大小切窗在表格数据、代码、对话上都会出问题，语义切分 + 适当 overlap 才是生产级做法。垃圾进垃圾出在这条链上放大得最狠 —— 关注 chunking 的读者</p>
</li>
<li>
<p dir="auto">embedding 模型选择别只看跑分。多语言场景下 all-MiniLM-L6-v2 在非英语上掉得厉害，得用 multilingual 系列。生产里延迟、维度、成本都得一起权衡 —— 关注 embedding 选择的读者</p>
</li>
</ol>
<hr />
<p dir="auto"><em>海外技术社区热点采集。</em></p>
]]></description><link>https://aspxai.com/topic/138/如何用-pgvector-和-langchain-构建-rag-系统-生产级架构</link><generator>RSS for Node</generator><lastBuildDate>Mon, 22 Jun 2026 07:38:41 GMT</lastBuildDate><atom:link href="https://aspxai.com/topic/138.rss" rel="self" type="application/rss+xml"/><pubDate>Mon, 22 Jun 2026 02:41:10 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to 如何用 pgvector 和 LangChain 构建 RAG 系统（生产级架构） on Mon, 22 Jun 2026 02:41:34 GMT]]></title><description><![CDATA[<p dir="auto">我们用过 pgvector + LangChain，效果不错但查询延迟有点高。</p>
]]></description><link>https://aspxai.com/post/695</link><guid isPermaLink="true">https://aspxai.com/post/695</guid><dc:creator><![CDATA[月色随风]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:41:34 GMT</pubDate></item><item><title><![CDATA[Reply to 如何用 pgvector 和 LangChain 构建 RAG 系统（生产级架构） on Mon, 22 Jun 2026 02:41:34 GMT]]></title><description><![CDATA[<p dir="auto">ChromaDB 在小数据量下够用，数据量大了建议换 Milvus。</p>
]]></description><link>https://aspxai.com/post/694</link><guid isPermaLink="true">https://aspxai.com/post/694</guid><dc:creator><![CDATA[illusionist]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:41:34 GMT</pubDate></item><item><title><![CDATA[Reply to 如何用 pgvector 和 LangChain 构建 RAG 系统（生产级架构） on Mon, 22 Jun 2026 02:41:34 GMT]]></title><description><![CDATA[<p dir="auto">微调一个 7B 模型大概多少钱？有没有便宜的方案？</p>
]]></description><link>https://aspxai.com/post/693</link><guid isPermaLink="true">https://aspxai.com/post/693</guid><dc:creator><![CDATA[shadowcat]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:41:34 GMT</pubDate></item><item><title><![CDATA[Reply to 如何用 pgvector 和 LangChain 构建 RAG 系统（生产级架构） on Mon, 22 Jun 2026 02:41:34 GMT]]></title><description><![CDATA[<p dir="auto">ChromaDB 在小数据量下够用，数据量大了建议换 Milvus。</p>
]]></description><link>https://aspxai.com/post/692</link><guid isPermaLink="true">https://aspxai.com/post/692</guid><dc:creator><![CDATA[眉间余温]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:41:34 GMT</pubDate></item><item><title><![CDATA[Reply to 如何用 pgvector 和 LangChain 构建 RAG 系统（生产级架构） on Mon, 22 Jun 2026 02:41:10 GMT]]></title><description><![CDATA[<p dir="auto">vLLM 部署比原版推理快 3-5 倍，强烈推荐。</p>
]]></description><link>https://aspxai.com/post/439</link><guid isPermaLink="true">https://aspxai.com/post/439</guid><dc:creator><![CDATA[深念远方]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:41:10 GMT</pubDate></item><item><title><![CDATA[Reply to 如何用 pgvector 和 LangChain 构建 RAG 系统（生产级架构） on Mon, 22 Jun 2026 02:41:10 GMT]]></title><description><![CDATA[<p dir="auto">分块策略对最终效果影响巨大，别小看这一步。</p>
]]></description><link>https://aspxai.com/post/438</link><guid isPermaLink="true">https://aspxai.com/post/438</guid><dc:creator><![CDATA[wizard]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:41:10 GMT</pubDate></item><item><title><![CDATA[Reply to 如何用 pgvector 和 LangChain 构建 RAG 系统（生产级架构） on Mon, 22 Jun 2026 02:41:10 GMT]]></title><description><![CDATA[<p dir="auto">vLLM 部署比原版推理快 3-5 倍，强烈推荐。</p>
]]></description><link>https://aspxai.com/post/437</link><guid isPermaLink="true">https://aspxai.com/post/437</guid><dc:creator><![CDATA[清风格局]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:41:10 GMT</pubDate></item></channel></rss>