<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[ik_llama.cpp 让 Qwen 3.5 的 prompt 处理速度提升 26 倍]]></title><description><![CDATA[<blockquote>
<p dir="auto">来源：r/LocalLLaMA</p>
</blockquote>
<p dir="auto"><strong>社区热议：</strong></p>
<ol>
<li>
<p dir="auto">26 倍不是 26%，是 26 倍！这在 prefill 瓶颈上简直是革命性的。 —— performance_junkie</p>
</li>
<li>
<p dir="auto">已经在我的工作流里集成了，效果确实惊人，长文档分析终于不卡了。 —— early_adopter</p>
</li>
<li>
<p dir="auto">Qwen 3.5 + 这个引擎的组合，可能是目前本地部署的最佳方案。 —— best_combo</p>
</li>
<li>
<p dir="auto">关键是把 graph splits 从 34 个降到 2 个，用 fused GDN CUDA kernel 让 CPU 几乎完全 idle，活全在 GPU 上干。 —— cuda_hacker</p>
</li>
<li>
<p dir="auto">Thireus fork 提供了 Windows CUDA 12.8 预编译二进制，和原版 llama-server 命令行参数完全兼容，drop-in 替换。 —— windows_user</p>
</li>
</ol>
<hr />
<p dir="auto"><em>海外技术社区热点采集。</em></p>
]]></description><link>https://aspxai.com/topic/98/ik_llama.cpp-让-qwen-3.5-的-prompt-处理速度提升-26-倍</link><generator>RSS for Node</generator><lastBuildDate>Mon, 22 Jun 2026 07:38:02 GMT</lastBuildDate><atom:link href="https://aspxai.com/topic/98.rss" rel="self" type="application/rss+xml"/><pubDate>Mon, 22 Jun 2026 02:41:03 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to ik_llama.cpp 让 Qwen 3.5 的 prompt 处理速度提升 26 倍 on Mon, 22 Jun 2026 02:41:48 GMT]]></title><description><![CDATA[<p dir="auto">我被封过一个账号，后来查出来是 IP 不干净，换了固定 IP 就好了。</p>
]]></description><link>https://aspxai.com/post/777</link><guid isPermaLink="true">https://aspxai.com/post/777</guid><dc:creator><![CDATA[frost29]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:41:48 GMT</pubDate></item><item><title><![CDATA[Reply to ik_llama.cpp 让 Qwen 3.5 的 prompt 处理速度提升 26 倍 on Mon, 22 Jun 2026 02:41:03 GMT]]></title><description><![CDATA[<p dir="auto">Max 比 Pro 多了 5 倍额度但价格是 5 倍，性价比其实一样。</p>
]]></description><link>https://aspxai.com/post/273</link><guid isPermaLink="true">https://aspxai.com/post/273</guid><dc:creator><![CDATA[无眛]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:41:03 GMT</pubDate></item><item><title><![CDATA[Reply to ik_llama.cpp 让 Qwen 3.5 的 prompt 处理速度提升 26 倍 on Mon, 22 Jun 2026 02:41:03 GMT]]></title><description><![CDATA[<p dir="auto">建议先订阅一个月 Pro，测测实际用量再决定是否升级。</p>
]]></description><link>https://aspxai.com/post/272</link><guid isPermaLink="true">https://aspxai.com/post/272</guid><dc:creator><![CDATA[菊黄舞剑]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:41:03 GMT</pubDate></item><item><title><![CDATA[Reply to ik_llama.cpp 让 Qwen 3.5 的 prompt 处理速度提升 26 倍 on Mon, 22 Jun 2026 02:41:03 GMT]]></title><description><![CDATA[<p dir="auto">商家说"永久稳定"基本都是骗人的，没有永久这回事。</p>
]]></description><link>https://aspxai.com/post/271</link><guid isPermaLink="true">https://aspxai.com/post/271</guid><dc:creator><![CDATA[明月亮三世]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:41:03 GMT</pubDate></item></channel></rss>