DeepSeek V3.1 在推理模式下的 token 效率优于 R1

夕阳追梦

来源：r/LocalLLaMA

社区热议：

token 效率是推理模型最被忽视的指标，V3.1 在这方面确实进步明显。 —— efficiency_nerd
如果能通过 RL 奖励塑形来惩罚冗长的思维链，效率还能进一步提升。 —— rl_practitioner
关键问题是：效率提升是在保持准确率的前提下吗？需要对比 accuracy parity。 —— rigorous_eval
V3.1 的混合架构优势就在这里：非思考模式省 token，思考模式又能控制 CoT 长度，不像 R1 每次都强制长推理。 —— hybrid_advocate
R1 的推理 token 是单独计费的，复杂任务可能产生 5-50 倍输出 token 的推理消耗，账单很容易爆。 —— billing_aware

海外技术社区热点采集。

晨曦驻足

说实话，有些观点我不太同意，但整体分析还是有道理的。

techguru54

说实话，有些观点我不太同意，但整体分析还是有道理的。

krakendeep

把这个转发给了团队讨论，大家的反应也挺热烈的。

夜枭

这个会不会对现有行业格局产生冲击？

明月亮来生

这个话题最近在 Twitter 上也很火，很多人都在讨论。

AI订阅指南