跳转至内容
  • 0 赞同
    1 帖子
    4 浏览
    A
    长上下文听起来像万能解法,但实际用下来,它的问题也很明显:能塞进去,不等于模型真的会用好。 常见翻车点有几个: 前面给的信息被后面冲淡 模型抓住了显眼段落,忽略了关键小字 多文档之间的冲突没处理 问题问得太泛,它不知道该看哪里 所以长上下文任务里,我不建议直接把几十页材料扔进去让模型“总结一下”。更好的做法是先让它建立目录感: 先列文档结构 标出和问题相关的章节 再围绕这些章节回答 最后要求引用依据 如果是企业知识库,长上下文也不一定替代 RAG。长上下文适合一次性读材料,RAG 适合长期、可更新、可检索的知识系统。 我的判断是:长上下文提高了上限,但没有取消信息组织能力。材料越长,越需要你帮模型建立路标。
  • 0 赞同
    1 帖子
    4 浏览
    A
    OpenAI、Claude、Gemini、DeepSeek、Qwen 怎么选?我现在不会直接问“哪个最好”,而是先问任务。 如果是复杂文档、代码理解、长推理,我会把 Claude 放进候选。 如果是生态、工具调用、第三方集成、产品化接口,OpenAI 仍然很强。 如果你重度依赖 Google 生态,或者任务里多模态和长上下文很多,Gemini 值得测。 如果你在国内做产品,DeepSeek、Qwen 这类模型的可获得性、成本、中文体验和部署选择都很现实。 真正要定主力模型时,我建议做一个小盲测:拿你团队最常见的 20 个任务,统一 Prompt,隐藏模型名,让实际使用的人打分。质量、速度、成本、稳定性、合规要求一起看。 不要只看榜单。榜单解决的是通用能力排序,项目里需要的是“在你的任务上少出错”。这两个不是一回事。 官方文档入口可以从 OpenAI、Anthropic、Google AI、DeepSeek、阿里云百炼分别看起,价格和能力以官方最新信息为准。
  • MCP 是什么、解决什么问题、怎么开始接?

    Prompt 与 Agent mcp agent tutorial claude
    1
    0 赞同
    1 帖子
    4 浏览
    A
    MCP 可以先不用理解得太玄。你可以把它看成:让 AI 更标准地连接外部工具的一套协议。 以前每个工具都要单独接一遍:文件系统怎么读、数据库怎么查、浏览器怎么控、内部 API 怎么调,各家方式不一样。MCP 想解决的是“工具接入标准化”。 它真正有价值的地方在这几个场景: AI 需要读本地项目文件 AI 需要查数据库或知识库 AI 需要调用公司内部系统 多个客户端想复用同一套工具能力 但我不建议新手一开始就堆很多 MCP Server。先接一个最小工具,比如只读文件、查一个接口、跑一个固定命令。确认权限边界和日志都清楚,再扩展。 尤其是企业场景,MCP 的重点不是“能不能调工具”,而是“谁能调、能调什么、调用记录在哪里、出错怎么追”。这些没想清楚,接得越多风险越大。 官方入口可以看 Anthropic 的 MCP 文档,先从概念和一个简单 server 开始就够了。
  • 0 赞同
    1 帖子
    5 浏览
    A
    我做过几次中文代码解释的小对比,感觉 DeepSeek、Qwen、Claude 的差异不是“谁一定赢”,而是风格不同。 Claude 通常解释得更稳,尤其是复杂调用链、边界条件、隐含假设,它更愿意把上下文讲完整。缺点是有时候篇幅偏长。 DeepSeek 在中文表达和代码理解之间的平衡不错,回答比较直接,适合快速看懂一段逻辑。对国内开发者来说,可获得性和成本也更友好。 Qwen 的优势是中文生态和国内部署选择多,做企业内部工具时比较容易纳入现有链路。解释业务代码时,如果上下文给得足,它也能做得不错。 我建议不要拿“解释一个函数”就决定主力模型。更好的测法是准备 10 个真实样本:老代码、异常栈、复杂 SQL、前后端联调、配置问题各放几个。让模型分别解释,再看谁更接近你团队的表达习惯。 模型选型最后不是排行榜问题,而是团队工作流问题。谁能让团队少误解、少返工,谁就更适合。