<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[DeepSeek-R1：通过强化学习激发 LLM 的推理能力]]></title><description><![CDATA[<blockquote>
<p dir="auto">来源：Hacker News</p>
</blockquote>
<p dir="auto"><strong>社区热议精选评论：</strong></p>
<ol>
<li>
<p dir="auto">550 万美元大约只能买 150 块 H100。我怀疑这个数字并未包含全部训练成本。 —— m_a_g</p>
</li>
<li>
<p dir="auto">我一直在困惑：R1 的训练成本是否也包含了基础模型 V3 的成本？因为 5.5M 美元训练这种规模的模型几乎不可能。 —— refulgentis</p>
</li>
<li>
<p dir="auto">DeepSeek R1 也把其他中国 LLM 团队打得落花流水，尽管他们预算更大、硬件更多。我怀疑是创始人来自量化基金的背景让他们更愿意承担有计算的风险。 —— logicchains</p>
</li>
<li>
<p dir="auto">美国经济建立在'AI 需要大量 GPU'的认知上？这未免有些夸张。 —— siliconc0w</p>
</li>
<li>
<p dir="auto">你提出了一个有趣的观点，而且两个论点都有广泛共识，但我强烈认为两者都有误：作者忽略了租用 GPU 之外的任何成本，他们还付费让 GPT-4 生成训练数据等等。 —— jvanderbot</p>
</li>
</ol>
<hr />
<p dir="auto"><em>本文为海外技术社区热点采集，更多 AI 资讯请关注 AI 订阅指南。</em></p>
]]></description><link>https://aspxai.com/topic/67/deepseek-r1-通过强化学习激发-llm-的推理能力</link><generator>RSS for Node</generator><lastBuildDate>Mon, 22 Jun 2026 07:38:24 GMT</lastBuildDate><atom:link href="https://aspxai.com/topic/67.rss" rel="self" type="application/rss+xml"/><pubDate>Mon, 22 Jun 2026 02:36:49 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to DeepSeek-R1：通过强化学习激发 LLM 的推理能力 on Mon, 22 Jun 2026 02:36:49 GMT]]></title><description><![CDATA[<p dir="auto">这个教程的第二步可以用更简单的方式实现，回头发个补充帖。</p>
]]></description><link>https://aspxai.com/post/91</link><guid isPermaLink="true">https://aspxai.com/post/91</guid><dc:creator><![CDATA[陌染]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:36:49 GMT</pubDate></item><item><title><![CDATA[Reply to DeepSeek-R1：通过强化学习激发 LLM 的推理能力 on Mon, 22 Jun 2026 02:36:49 GMT]]></title><description><![CDATA[<p dir="auto">这个教程的第二步可以用更简单的方式实现，回头发个补充帖。</p>
]]></description><link>https://aspxai.com/post/90</link><guid isPermaLink="true">https://aspxai.com/post/90</guid><dc:creator><![CDATA[tiger]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:36:49 GMT</pubDate></item><item><title><![CDATA[Reply to DeepSeek-R1：通过强化学习激发 LLM 的推理能力 on Mon, 22 Jun 2026 02:36:49 GMT]]></title><description><![CDATA[<p dir="auto">这个教程的第二步可以用更简单的方式实现，回头发个补充帖。</p>
]]></description><link>https://aspxai.com/post/89</link><guid isPermaLink="true">https://aspxai.com/post/89</guid><dc:creator><![CDATA[观雪风骨]]></dc:creator><pubDate>Mon, 22 Jun 2026 02:36:49 GMT</pubDate></item></channel></rss>