学习让 LLM 学会推理（OpenAI o1）

krakendeep

来源：Hacker News

社区热议精选评论：

1673 ELO 太疯狂了。如果实际成立，我实在想不出还有什么场景雇佣初级或中级开发者会更便宜。 —— spaceman_2020
我不确定 Codeforces 百分位与软件工程能力有多大相关性。AlphaCode 2 去年就到 1650 了，SWE-bench 在 Agent 下只从 33.2% 跳到 35.8%，并不算革命性。 —— usaar333
这与'苦涩教训'并不矛盾。与其把模型做到 10N 参数，不如训练 N 参数模型并让它在推理时多算 10 倍。 —— grbsh
这新方法表明：1）'苦涩教训'可能不成立，Transformer 智能存在根本极限；2）'苦涩教训'成立，只是没有足够的数据/算力/能源来训练 AGI。所有认知本应发生在 Transformer 内部，这感觉像是通向 AGI 之路上的支线任务。 —— dinobones
注意力机制本质上是关于相似性/统计相关性，是随机性的；而推理需要真实和精确才能成功。 —— seydor

本文为海外技术社区热点采集，更多 AI 资讯请关注 AI 订阅指南。

夜枭

太有用了，正好在找这方面的资料，收藏了慢慢消化。

蒹葭念旧

这篇写得特别清楚，比官方文档好理解多了，感谢整理。

未眠拾光

这篇写得特别清楚，比官方文档好理解多了，感谢整理。

ember

这个教程的第二步可以用更简单的方式实现，回头发个补充帖。

galaxyquest58

后面会更新进阶部分吗？期待高级用法的教程。

AI订阅指南