<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[Chunk Size 优化：如何切分文档让 RAG 效果最好]]></title><description><![CDATA[<blockquote>
<p dir="auto">来源：AI 订阅指南</p>
</blockquote>
<p dir="auto">文档切分（Chunking）是 RAG 中最被忽略但最关键的环节。</p>
<p dir="auto"><strong>常见切分策略：</strong></p>
<ol>
<li>
<p dir="auto"><strong>固定长度切分</strong></p>
<ul>
<li>简单但可能截断语义</li>
<li>推荐 500-1000 tokens</li>
</ul>
</li>
<li>
<p dir="auto"><strong>递归字符切分</strong></p>
<ul>
<li>按段落 → 句子 → 词递归</li>
<li>保持语义完整性</li>
</ul>
</li>
<li>
<p dir="auto"><strong>语义切分</strong></p>
<ul>
<li>使用 Embedding 检测语义边界</li>
<li>效果最好但成本高</li>
</ul>
</li>
</ol>
<p dir="auto"><strong>最佳实践：</strong></p>
<ul>
<li>Chunk Size：512 tokens（通用）</li>
<li>Overlap：50-100 tokens</li>
<li>分隔符优先级：\n\n &gt; \n &gt; 。 &gt; 空格</li>
</ul>
<p dir="auto"><strong>工具</strong>：LangChain 的 RecursiveCharacterTextSplitter</p>
<hr />
<p dir="auto"><em>更多 RAG 教程请关注 AI 订阅指南。</em></p>
]]></description><link>https://aspxai.com/topic/232/chunk-size-优化-如何切分文档让-rag-效果最好</link><generator>RSS for Node</generator><lastBuildDate>Mon, 22 Jun 2026 07:37:56 GMT</lastBuildDate><atom:link href="https://aspxai.com/topic/232.rss" rel="self" type="application/rss+xml"/><pubDate>Mon, 22 Jun 2026 03:02:00 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to Chunk Size 优化：如何切分文档让 RAG 效果最好 on Mon, 22 Jun 2026 03:03:34 GMT]]></title><description><![CDATA[<p dir="auto">微调一个 7B 模型大概多少钱？有没有便宜的方案？</p>
]]></description><link>https://aspxai.com/post/1084</link><guid isPermaLink="true">https://aspxai.com/post/1084</guid><dc:creator><![CDATA[松风焚香]]></dc:creator><pubDate>Mon, 22 Jun 2026 03:03:34 GMT</pubDate></item><item><title><![CDATA[Reply to Chunk Size 优化：如何切分文档让 RAG 效果最好 on Mon, 22 Jun 2026 03:03:34 GMT]]></title><description><![CDATA[<p dir="auto">知识库更新频率也是个问题，我们做了增量索引方案。</p>
]]></description><link>https://aspxai.com/post/1083</link><guid isPermaLink="true">https://aspxai.com/post/1083</guid><dc:creator><![CDATA[林深归途]]></dc:creator><pubDate>Mon, 22 Jun 2026 03:03:34 GMT</pubDate></item></channel></rss>