<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[DeepSeek 3.2 的稀疏注意力机制解析]]></title><description><![CDATA[<blockquote>
<p dir="auto">来源：r/MachineLearning</p>
</blockquote>
<p dir="auto"><strong>社区热议精选评论：</strong></p>
<ol>
<li>
<p dir="auto">DeepSeek 在注意力优化上一直走在前面，MLA 已经很惊艳了，这个稀疏变体又推进了一步。 —— attention_expert</p>
</li>
<li>
<p dir="auto">关键是这种稀疏化是可学习的还是预设的？论文里好像没有完全说清楚。 —— detail_oriented</p>
</li>
<li>
<p dir="auto">如果能开源实现的话，对本地部署社区会是巨大的利好。 —— local_deploy</p>
</li>
<li>
<p dir="auto">Lightning Indexer 这个设计太聪明了，用极少头数 + FP8 + ReLU 来做相关性打分，成本极低。 —— indexer_fan</p>
</li>
<li>
<p dir="auto">核心是把复杂度从 O(L²) 降到 O(L*k)，k 默认 2048，长上下文场景下 prefill 成本只有原来的 1/3 到 1/2。 —— complexity_analyst</p>
</li>
</ol>
<hr />
<p dir="auto"><em>本文为海外技术社区热点采集，更多 AI 资讯请关注 AI 订阅指南。</em></p>
]]></description><link>https://aspxai.com/topic/86/deepseek-3.2-的稀疏注意力机制解析</link><generator>RSS for Node</generator><lastBuildDate>Mon, 22 Jun 2026 07:43:29 GMT</lastBuildDate><atom:link href="https://aspxai.com/topic/86.rss" rel="self" type="application/rss+xml"/><pubDate>Mon, 22 Jun 2026 02:36:52 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to DeepSeek 3.2 的稀疏注意力机制解析 on Mon, 22 Jun 2026 02:41:52 GMT]]></title><description><![CDATA[<p dir="auto">说实话，有些观点我不太同意，但整体分析还是有道理的。</p>
]]></description><link>https://aspxai.com/post/794</link><guid isPermaLink="true">https://aspxai.com/post/794</guid><dc:creator><![CDATA[vertex28]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:41:52 GMT</pubDate></item><item><title><![CDATA[Reply to DeepSeek 3.2 的稀疏注意力机制解析 on Mon, 22 Jun 2026 02:41:52 GMT]]></title><description><![CDATA[<p dir="auto">这个话题最近在 Twitter 上也很火，很多人都在讨论。</p>
]]></description><link>https://aspxai.com/post/793</link><guid isPermaLink="true">https://aspxai.com/post/793</guid><dc:creator><![CDATA[曼凡]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:41:52 GMT</pubDate></item><item><title><![CDATA[Reply to DeepSeek 3.2 的稀疏注意力机制解析 on Mon, 22 Jun 2026 02:41:52 GMT]]></title><description><![CDATA[<p dir="auto">把这个转发给了团队讨论，大家的反应也挺热烈的。</p>
]]></description><link>https://aspxai.com/post/792</link><guid isPermaLink="true">https://aspxai.com/post/792</guid><dc:creator><![CDATA[指尖惊鸿]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:41:52 GMT</pubDate></item><item><title><![CDATA[Reply to DeepSeek 3.2 的稀疏注意力机制解析 on Mon, 22 Jun 2026 02:41:52 GMT]]></title><description><![CDATA[<p dir="auto">把这个转发给了团队讨论，大家的反应也挺热烈的。</p>
]]></description><link>https://aspxai.com/post/791</link><guid isPermaLink="true">https://aspxai.com/post/791</guid><dc:creator><![CDATA[醉清风韵味]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:41:52 GMT</pubDate></item><item><title><![CDATA[Reply to DeepSeek 3.2 的稀疏注意力机制解析 on Mon, 22 Jun 2026 02:36:52 GMT]]></title><description><![CDATA[<p dir="auto">这个会不会对现有行业格局产生冲击？</p>
]]></description><link>https://aspxai.com/post/167</link><guid isPermaLink="true">https://aspxai.com/post/167</guid><dc:creator><![CDATA[galaxyquest58]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:36:52 GMT</pubDate></item><item><title><![CDATA[Reply to DeepSeek 3.2 的稀疏注意力机制解析 on Mon, 22 Jun 2026 02:36:52 GMT]]></title><description><![CDATA[<p dir="auto">这个会不会对现有行业格局产生冲击？</p>
]]></description><link>https://aspxai.com/post/166</link><guid isPermaLink="true">https://aspxai.com/post/166</guid><dc:creator><![CDATA[傲骨]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:36:52 GMT</pubDate></item><item><title><![CDATA[Reply to DeepSeek 3.2 的稀疏注意力机制解析 on Mon, 22 Jun 2026 02:36:52 GMT]]></title><description><![CDATA[<p dir="auto">这个会不会对现有行业格局产生冲击？</p>
]]></description><link>https://aspxai.com/post/165</link><guid isPermaLink="true">https://aspxai.com/post/165</guid><dc:creator><![CDATA[数星星客栈]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:36:52 GMT</pubDate></item></channel></rss>