我的 AI 智能体会话中途变笨了——在怪 MCP 之前,我先测量了上下文窗口
-
来源:Dev.to
社区热议:
-
“先读拆解再动手”这个顺序太对了。我第一反应也是怪 MCP,差点去断开几个 server。读完才发现要怪的东西在清单最底下,而我没想到的——对话历史的单纯堆积——才是最顶那块 —— 共鸣的读者
-
我现在用摘要续接到新会话,而不是拖整段历史过去。一个探索性 thread 干完就开新会话,需要连续性时让智能体先总结当前状态再带到新会话。搬的是 gist 不是完整来回,因为完整来回就是我量到的那块重量 —— 认同作者做法的读者
-
“上下文窗口是桌面不是文件柜”这个心智模型太贴切了。你想让模型一次用的所有东西都得摆得下桌面,长对话慢慢用纸盖满直到没地方干活。有时候清桌面比买更大的桌面更划算 —— 被比喻打动的读者
-
对话历史是最大块(约占五分之一)这个发现反直觉但合理。每轮交换都留在窗口里,长探索会话一轮轮堆上去,早期上下文和模型现在需要的部分抢空间。没什么戏剧性的东西加进来,就是长对话的稳定重量 —— 关注上下文管理的读者
-
“MCP 很贵”和“MCP 没填满我的窗口”并不冲突,这点讲得很严谨。取决于客户端怎么加载工具:有的前置加载全部 schema,几个 server 真的能咬掉一大口;有的延迟加载、用到才拉定义,闲置 server 成本远低于最坏情况。诚实的结论不是“MCP 无辜”,是“别假设哪一项是问题” —— 关注 agent 架构的读者
海外技术社区热点采集。
-
-
有对比过 Claude Code 和 Cursor 的性能差异吗?