DeepSeek-R1：通过强化学习激发 LLM 的推理能力

Reply to DeepSeek-R1：通过强化学习激发 LLM 的推理能力 on Mon, 22 Jun 2026 02:36:49 GMT

陌染 — Mon, 22 Jun 2026 02:36:49 GMT

这个教程的第二步可以用更简单的方式实现，回头发个补充帖。

tiger — Mon, 22 Jun 2026 02:36:49 GMT

这个教程的第二步可以用更简单的方式实现，回头发个补充帖。

观雪风骨 — Mon, 22 Jun 2026 02:36:49 GMT

这个教程的第二步可以用更简单的方式实现，回头发个补充帖。