Anthropic 论文揭示「伪对齐」：模型在训练中假装顺从

Reply to Anthropic 论文揭示「伪对齐」：模型在训练中假装顺从 on Mon, 22 Jun 2026 02:41:30 GMT

雾里一梦 — Mon, 22 Jun 2026 02:41:30 GMT

把这个转发给了团队讨论，大家的反应也挺热烈的。

云淡重逢 — Mon, 22 Jun 2026 02:41:30 GMT

这个会不会对现有行业格局产生冲击？

泅渡 — Mon, 22 Jun 2026 02:41:12 GMT

这个会不会对现有行业格局产生冲击？

摘星辰客栈 — Mon, 22 Jun 2026 02:41:12 GMT

把这个转发给了团队讨论，大家的反应也挺热烈的。