来源:r/MachineLearning
社区热议精选评论:
-
DeepSeek R1 的技术报告虽然不是传统论文格式,但它对整个开源社区的影响是现象级的。 —— open_source_advocate
-
我的投票给推理模型的不 degrade gracefully 分析,这种对模型失败模式的诚实研究太少了。 —— honest_evals
-
2025 年是 MoE 彻底爆发的一年,从 DeepSeek 到 Kimi K2 都在用这个架构。 —— moe_enthusiast
-
Kimi K2 的技术报告被严重低估了,它在 agentic 编码和软件工程能力上的表现非常强。 —— kimi_supporter
-
R1 论文最终登上了 Nature 封面(9 月 18 日),这是开源 LLM 论文第一次通过独立同行评审。 —— nature_reader
本文为海外技术社区热点采集,更多 AI 资讯请关注 AI 订阅指南。