学习让 LLM 学会推理(OpenAI o1)
-
来源:Hacker News
社区热议精选评论:
-
1673 ELO 太疯狂了。如果实际成立,我实在想不出还有什么场景雇佣初级或中级开发者会更便宜。 —— spaceman_2020
-
我不确定 Codeforces 百分位与软件工程能力有多大相关性。AlphaCode 2 去年就到 1650 了,SWE-bench 在 Agent 下只从 33.2% 跳到 35.8%,并不算革命性。 —— usaar333
-
这与'苦涩教训'并不矛盾。与其把模型做到 10N 参数,不如训练 N 参数模型并让它在推理时多算 10 倍。 —— grbsh
-
这新方法表明:1)'苦涩教训'可能不成立,Transformer 智能存在根本极限;2)'苦涩教训'成立,只是没有足够的数据/算力/能源来训练 AGI。所有认知本应发生在 Transformer 内部,这感觉像是通向 AGI 之路上的支线任务。 —— dinobones
-
注意力机制本质上是关于相似性/统计相关性,是随机性的;而推理需要真实和精确才能成功。 —— seydor
本文为海外技术社区热点采集,更多 AI 资讯请关注 AI 订阅指南。
-
-
后面会更新进阶部分吗?期待高级用法的教程。