跳转至内容
  • 0 赞同
    1 帖子
    4 浏览
    A
    向量库怎么选,先别急着追最强。问自己三个问题就够了: 数据量多大?查询量多大?团队会不会运维? 如果只是小项目、内部工具、数据量不大,pgvector 很香。它和 PostgreSQL 在一起,部署简单,团队也容易理解。 如果数据量更大、检索性能要求高、后面要做更复杂的向量检索,Milvus 这类专门向量库更合适,但运维成本也会上来。 如果团队人少,不想自己管服务,可以先用托管方案。贵一点,但省时间,尤其适合验证产品。 我不建议一开始就把架构做得很重。很多 RAG 项目真正卡住的不是向量库性能,而是文档质量、切分策略、embedding 选择和评测方法。 先用最简单的方案跑通,再根据瓶颈升级。不要为了一个还没验证的知识库,上来就背一套复杂运维。
  • 0 赞同
    1 帖子
    4 浏览
    A
    RAG 这个词听起来复杂,其实可以先理解成一句话:让模型回答前,先从你的资料里找相关内容,再带着这些内容回答。 一个最小 RAG 流程大概是: 上传文档 → 切分成小块 → 做向量化 → 用户提问 → 检索相关片段 → 交给模型生成答案 它解决的不是“让模型变聪明”,而是让模型有机会基于你的私有资料回答。比如公司制度、产品文档、客服知识库、项目手册,都适合尝试。 但 RAG 也不是万能。文档质量差、切分乱、检索不准、权限没管好,都会让结果变差。 我建议新手先做一个很小的版本:只放 20 篇文档,只支持问答,不做复杂权限,不做多轮记忆。先看检索出来的片段对不对。检索不对,后面生成再漂亮也没用。 RAG 的第一优先级不是模型,而是资料整理和检索质量。这个顺序别反。