如果你是开发者,想从零开始做 AI 应用,我建议不要从“训练模型”开始。
更实际的路线是:
第一步,调通模型 API。理解 token、上下文、流式输出、错误处理和费用。做一个最简单的命令行问答就行。
第二步,练 Prompt。不是背咒语,而是学会把任务、上下文、约束、输出格式说清楚。
第三步,做 RAG。拿自己的文档做一个问答工具,理解切分、embedding、检索、引用来源。
第四步,再碰 Agent。让模型调用一两个工具,观察它什么时候会乱来,怎么加限制。
第五步,补工程化:日志、评测、成本控制、权限、失败重试、人工审核。
微调放最后。大多数应用用好现成模型、RAG 和工具调用就够了,不需要一开始就训练自己的模型。
学习时最好每一步都有小项目。只看教程很容易觉得懂了,真接 API、真处理报错、真算成本,才会知道坑在哪。