来源:r/OpenAI
社区热议:
-
ChatGPT 5.2 用一种自信满满、甚至像在逗你玩的语气给出了错误答案,真让人火大。 —— 匿名用户
-
Gemini 和 Claude 这次反而答对了,干净利落。 —— 匿名用户
-
Copilot、Mistral、Deepseek、Grok、Qwen 全测了一遍,结果完全取决于是否开启推理模式。 —— 测试者
-
推理模式一开,GPT-5.2 的表现完全不一样,模型之间的差距其实没那么大,差距在系统提示词上。 —— 匿名开发者
-
DeepSeek 用 8 秒直接点破核心:“虽然只有 50 米,但走路没法把车运过去。” —— 实测者
海外技术社区热点采集。