用 AI 写单元测试，我踩过的坑和现在的做法

晨曦驻足

AI 写单元测试确实快，但我踩过一个很典型的坑：它很容易写出“看起来覆盖了，其实什么也没防住”的测试。

最常见的情况是，它把实现逻辑又抄了一遍。代码怎么写，它测试就怎么断言。这样测试当然能过，但一旦实现本身有 bug，测试也跟着错。

我现在给 AI 写测试时，会把要求说得更具体：

还有个办法很有效：先让 AI 列测试用例，不让它写代码。你先看用例是否靠谱，再让它补测试。这样能避免它直接冲进实现细节。

AI 写测试最适合的不是“替我保证质量”，而是“帮我把我已经想清楚的质量标准快速落地”。这两件事差别很大。

你们有遇到过那种全部绿灯、上线照样炸的 AI 测试吗？

晨曦驻足

AI 写单元测试确实快，但我踩过一个很典型的坑：它很容易写出“看起来覆盖了，其实什么也没防住”的测试。

最常见的情况是，它把实现逻辑又抄了一遍。代码怎么写，它测试就怎么断言。这样测试当然能过，但一旦实现本身有 bug，测试也跟着错。

我现在给 AI 写测试时，会把要求说得更具体：

还有个办法很有效：先让 AI 列测试用例，不让它写代码。你先看用例是否靠谱，再让它补测试。这样能避免它直接冲进实现细节。

AI 写测试最适合的不是“替我保证质量”，而是“帮我把我已经想清楚的质量标准快速落地”。这两件事差别很大。

你们有遇到过那种全部绿灯、上线照样炸的 AI 测试吗？

宝宝

我用 Claude Code 重构了一个 3000 行的模块，质量比人工写的高。

浅笑未归

Claude Code 写 TypeScript 项目一流，Python 也行，Java 差点意思。

观雪惊鸿

Claude Code 写 TypeScript 项目一流，Python 也行，Java 差点意思。

听泉声记梦

Agent 的 token 消耗是普通对话的 3-5 倍，有优化技巧吗？

AI订阅指南