DeepSeek-R1：通过强化学习激发 LLM 的推理能力

醉清风忘机

来源：Hacker News

社区热议精选评论：

550 万美元大约只能买 150 块 H100。我怀疑这个数字并未包含全部训练成本。 —— m_a_g
我一直在困惑：R1 的训练成本是否也包含了基础模型 V3 的成本？因为 5.5M 美元训练这种规模的模型几乎不可能。 —— refulgentis
DeepSeek R1 也把其他中国 LLM 团队打得落花流水，尽管他们预算更大、硬件更多。我怀疑是创始人来自量化基金的背景让他们更愿意承担有计算的风险。 —— logicchains
美国经济建立在'AI 需要大量 GPU'的认知上？这未免有些夸张。 —— siliconc0w
你提出了一个有趣的观点，而且两个论点都有广泛共识，但我强烈认为两者都有误：作者忽略了租用 GPU 之外的任何成本，他们还付费让 GPT-4 生成训练数据等等。 —— jvanderbot

本文为海外技术社区热点采集，更多 AI 资讯请关注 AI 订阅指南。

观雪风骨

这个教程的第二步可以用更简单的方式实现，回头发个补充帖。

tiger

这个教程的第二步可以用更简单的方式实现，回头发个补充帖。

陌染

这个教程的第二步可以用更简单的方式实现，回头发个补充帖。

AI订阅指南