跳转至内容
  • AI 开发者工具清单 2026(按用途分类)

    已固定 资源与教程 resource ai-coding agent rag
    1
    0 赞同
    1 帖子
    5 浏览
    A
    给刚入门的 AI 开发者一份工具清单。我不追求全,先按用途分,能跑通一条链路就行。 写代码: GitHub Copilot:轻量补全 Cursor:编辑器里改代码很顺手 Claude Code / Codex:更适合让 AI 读项目、改多文件、跑任务 做 Prompt 和 Agent: Dify:适合先搭工作流 LangChain / LlamaIndex:适合更工程化地组织链路 MCP:适合给 AI 接工具,但要注意权限 做 RAG: pgvector:小团队、简单项目可以先用 Milvus:数据量和性能要求上来后再考虑 embedding 模型:一定要拿中文资料实测 模型 API: OpenAI、Claude、Gemini 可以做能力对比 DeepSeek、Qwen、Kimi 更适合国内可获得性和成本优先的场景 我的建议是别收藏一百个工具。先选一个编程工具、一个模型 API、一个 RAG 框架,做出一个能问自己文档的小项目。跑通之后,你自然知道下一步缺什么。
  • 0 赞同
    1 帖子
    4 浏览
    A
    看一个开源 AI 项目,我不建议先看 star 数。star 只能说明它被关注过,不能说明你能不能用。 我会按这个顺序拆: 它解决什么问题?一句话能不能说清 最近还维护吗?看 commit、issue、release 文档能不能跑通?不要只看 README 漂亮 核心抽象是什么?比如 Agent、工具、检索、工作流怎么组织 适合二开吗?插件、配置、接口是否清楚 许可证能不能商用 如果是 RAG/Agent 类框架,我还会特别看失败处理。比如工具调用失败怎么办、检索为空怎么办、模型输出格式错了怎么办。这些地方比 demo 更能看出项目成熟度。 真正值得学习的开源项目,不只是“能跑”,而是它在复杂场景里怎么划边界、怎么处理错误、怎么组织扩展点。 大家如果看到不错的开源 AI 项目,也欢迎发到这个板块。最好不只贴链接,顺手写两句你觉得它好在哪里。
  • 0 赞同
    1 帖子
    8 浏览
    A
    多步 Agent 最容易失败的地方,往往不是模型完全不会,而是中间某一步偏了,后面还继续认真执行。 我见过比较多的是这几种: 一开始理解错目标,后面越努力越偏 工具返回异常,它假装没事继续编 查到旧资料,却当成最新信息 中间结果没有校验,直接进入下一步 权限边界不清楚,尝试做不该做的动作 防法也不复杂,但要提前设计: 关键节点让它停下来确认 工具调用失败必须显式报错 涉及时效信息要求标注来源和日期 每一步输出可检查的中间结果 高风险动作只给建议,不自动执行 Agent 不是越自主越好。很多业务场景里,“半自动 + 人确认”比“全自动”更靠谱。 如果你们的 Agent 已经上线,我建议先把失败案例收集起来。真实失败样本比漂亮 demo 更值钱,它会告诉你系统到底哪里脆。
  • 0 赞同
    1 帖子
    5 浏览
    A
    判断一个 Agent 好不好用,不能只看 demo。Demo 里跑通一次不难,难的是连续跑 100 次还能稳定。 我会看这几个指标: 成功率:同类任务跑多次,多少次能完成 返工率:完成后还需要人改多少 可解释性:失败时能不能知道卡在哪一步 成本:一次任务平均花多少 token 和时间 权限边界:会不会调用不该调用的工具 恢复能力:中间失败后能不能重试或降级 很多 Agent 看起来聪明,其实只是“偶尔很惊艳”。但产品里需要的是稳定,不是抽奖。 我比较喜欢给 Agent 做一组固定评测集,比如 20 个真实任务,每次改 Prompt、换模型、换工具后都跑一遍。不要凭感觉判断“好像变聪明了”,要看数据。 还有一点很重要:评测不要只看最终答案。中间步骤也要看。一个答案对了但过程乱来的 Agent,迟早会在更复杂的任务里出问题。
  • 0 赞同
    1 帖子
    4 浏览
    A
    我第一次接 MCP 时,没有做复杂系统,只做了一个很小的本地工作流:让 AI 读取项目里的几个说明文件,然后根据固定规则生成一份检查清单。 这个练习的好处是边界清楚: 工具只读文件,不写文件 只能访问指定目录 输出只是建议,不自动执行 每次调用都能看到输入和结果 跑通之后,你会更容易理解 MCP 的价值:模型不再只靠聊天上下文,它可以通过工具拿到更接近真实环境的信息。 但这里也有个坑。工具一多,模型会变得“很忙”,不一定更准。它可能反复查无关文件,也可能在权限不清楚时做多余动作。所以我觉得 MCP 的第一课不是“怎么接更多工具”,而是“怎么限制工具”。 我的建议是:先做只读,再做可写;先做单工具,再做多工具;先给测试环境,再碰生产环境。 如果你已经接过 MCP,最想听你们分享的是权限怎么做,而不是 server 数量有多少。
  • MCP 是什么、解决什么问题、怎么开始接?

    Prompt 与 Agent mcp agent tutorial claude
    1
    0 赞同
    1 帖子
    4 浏览
    A
    MCP 可以先不用理解得太玄。你可以把它看成:让 AI 更标准地连接外部工具的一套协议。 以前每个工具都要单独接一遍:文件系统怎么读、数据库怎么查、浏览器怎么控、内部 API 怎么调,各家方式不一样。MCP 想解决的是“工具接入标准化”。 它真正有价值的地方在这几个场景: AI 需要读本地项目文件 AI 需要查数据库或知识库 AI 需要调用公司内部系统 多个客户端想复用同一套工具能力 但我不建议新手一开始就堆很多 MCP Server。先接一个最小工具,比如只读文件、查一个接口、跑一个固定命令。确认权限边界和日志都清楚,再扩展。 尤其是企业场景,MCP 的重点不是“能不能调工具”,而是“谁能调、能调什么、调用记录在哪里、出错怎么追”。这些没想清楚,接得越多风险越大。 官方入口可以看 Anthropic 的 MCP 文档,先从概念和一个简单 server 开始就够了。
  • 0 赞同
    1 帖子
    4 浏览
    A
    现在很多需求一上来就想做 Agent,但我会先问一个很土的问题:这个任务的步骤能不能写死? 如果能写死,先别上 Agent。用普通 Prompt、工作流、规则链,通常更便宜、更稳定、更好调。 适合 Prompt 的任务: 总结一篇文章 改写一段文案 从固定文本里抽字段 做简单分类 适合 Agent 的任务: 需要查资料 要调用工具 每一步取决于上一步结果 失败后要换策略 要操作外部系统 Agent 的问题不是“不强”,而是复杂度高。它会带来调试成本、token 成本、权限风险、失败重试,还有一个很现实的问题:出了错你不一定知道它是哪一步错的。 所以我的判断是:先工作流,后 Agent。先把能确定的步骤确定下来,只把真正需要模型判断的部分交给模型。 你们现在做的 Agent 项目里,有多少其实可以拆成普通工作流?
  • 0 赞同
    1 帖子
    5 浏览
    A
    让 AI 改大型代码库,我最不推荐的说法是:“帮我把这个模块重构一下。” 这句话太大了。AI 会努力完成,但它不知道你真正能接受的风险边界在哪里。结果往往是:改动很多,diff 很漂亮,你却不敢合。 我更愿意把任务拆成这种形状: 第一步,只读代码,画出调用关系 第二步,只改命名,不动行为 第三步,补测试,确认当前行为 第四步,做最小结构调整 第五步,跑测试,整理剩余风险 这里的关键不是“AI 会不会写”,而是每一步都能被检查。大代码库最怕不可验证的聪明改动。 还有个经验:让 AI 每次改完都总结“它改了什么、为什么改、还没确认什么”。这个总结很有用,因为你 review 的时候能顺着它的意图看 diff,而不是在几十个文件里迷路。 大项目里,AI 最适合做耐心活:读文件、找引用、列影响面、补重复测试、批量替换。真正的架构判断还是要人来定。