某 300 人规模的机械制造企业,CIO 上个月带着一份「AI 客服自研方案」来找我们复盘。他去年拉了 3 个 AI 工程师,规划 6 个月做完一个内部客服 Agent,预算 80 万人力工资。结果半年过去,Agent 还停在「本地跑通了一个 demo」的状态——原因不是团队不行,而是他们把 60% 的时间花在了「搭底座、选模型、写 RAG 框架、做 UI」上。最后 CIO 花 8 万签了一年现成 SaaS,2 周上线,效果比自研版还稳。他跟我们说了一句:「我一直以为自研更划算,账算完才发现是把'省下的授权费'扔进了工资池。」
这不是个案。AI Agent 项目里最贵的决策,不是选哪家模型、也不是选哪个框架,而是「这个场景到底该自研还是该买」——这一步错了,后面每一步都在为它买单。这篇给一份 6 维决策矩阵,把这一步一次说清:什么信号该自研、什么信号该买、什么情况该混着来,最后给一份能直接打分的自检表。
一、为什么「自研更划算」总是听起来划算,真做起来贵
先说清一件事:绝大多数企业 CTO 第一次算「自研 vs 买」的账时,都会犯 3 个财务假账,导致自研的账面成本被系统性低估。这 3 个假账不修正,后面 6 维矩阵怎么算都是错的。
第 1 个假账:只算工程师工资,不算团队维护成本。CTO 算账通常是「3 个人 × 6 个月 = 18 人月」,按 3 万月薪算是 54 万。但真实成本还要加上:招聘成本(AI 工程师市面平均猎头费 3-6 万一人)、期权稀释、社保和奖金约 30% 溢价、以及最重要的——上线后每年的维护人力(通常是自研成本的 40-60%)。把这几项加齐,54 万的账面成本实际是 90-120 万,第 2 年还要继续付 40-60 万维护。
第 2 个假账:把「大模型 API 费用」当成唯一线上成本。这是最烧钱的一个假账。自研 AI Agent 上线后,除了模型调用费,还有向量库托管、日志和监控存储、GPU 推理机器(如果跑私有化模型)、以及安全审计合规成本。我们见过一家 400 人企业,自研的知识问答 Agent 上线 9 个月,模型 API 只花了 3 万,向量库和 GPU 加起来花了 22 万,这个比例在自研项目里是常态。
第 3 个假账:忽略时间和机会成本。团队花 6-9 个月自研一个通用场景,同期竞争对手可能已经买了 SaaS、在第 3 个月就用起来了。这 6 个月的时间差不出现在任何一张 P&L 表上,但在快速迭代型行业里就是致命的。
三个假账修正完,很多原来「自研省钱」的场景会变成「自研贵 2-3 倍」。真实决策要基于修正后的账。
二、6 维决策矩阵总表:把 6 个维度钉在一张表里
自研 vs 买的核心决策维度只有 6 个:场景独特性、数据敏感度、团队 AI 工程能力、预算深度、上线时效、长期演进意愿。任何一维打出「强自研信号」并不代表要自研,需要 6 维综合打分,下面这张是我们给客户做「自研 vs 买」诊断时反复打磨出来的对照表:
| 维度 | 强自研信号 | 强买 SaaS 信号 | 常见误判 |
|---|---|---|---|
| 场景独特性 | 深度绑定业务流程,市面无对应产品 | 通用场景(问答/纪要/客服) | 把「我们做法不一样」当独特性 |
| 数据敏感度 | 涉及交易 / 医疗 / 合规红线数据 | 内部知识、非敏感业务数据 | 把「所有数据都不能外传」一刀切 |
| 团队 AI 工程能力 | 有 3+ 人稳定 AI 工程经验 | 无稳定团队或人员流动大 | 把「有工程师」等同于「能做 Agent」 |
| 预算深度 | 3 年 TCO 预算充裕(>200 万) | 前期预算紧、每年订阅可接受 | 只算前期不算 3-5 年 TCO |
| 上线时效 | 允许 4-6 个月以上迭代 | 3 个月内必须见效 | 高估自研的迭代速度 |
| 长期演进意愿 | 战略上把 AI 定为长期能力 | 短期项目 / 一次性场景 | 把「先试试」当长期战略 |
这张表用 3 步:第 1 步把待评估的场景在每个维度上落一个位置(1-5 分,1 分为强买、5 分为强自研);第 2 步算 6 维总分;第 3 步落到决策象限。总分 24 分以上强烈建议自研或深度定制,12 分以下建议买 SaaS,12-24 分之间是混合方案区间——这个区间是大多数企业实际的落点。
三、维度 1:场景独特性——越通用越该买,越独特越该自研
场景独特性是 6 维里权重最高的一维,判断口径是:「同样的场景,你和你竞争对手的做法差多少」。如果差异不到 20%,几乎肯定该买;如果差异超过 60%,几乎肯定要自研或定制。
| 场景类型 | 独特性打分 | 推荐路径 | 典型案例 |
|---|---|---|---|
| 内部知识问答 | 1-2 分 | 买 SaaS | 员工手册问答、政策查询 |
| 会议纪要 / 转录 | 1-2 分 | 买 SaaS | 通用会议整理、语音转文字 |
| 通用客服话术 | 2-3 分 | 买 SaaS + 轻定制 | 电商咨询、售后应答 |
| 销售线索初筛 | 3-4 分 | 定制开发 | 结合企业 CRM 打分模型 |
| 行业专家型 Agent | 4-5 分 | 深度定制 / 自研 | 法律合同审查、医疗辅助 |
| 业务核心决策 Agent | 5 分 | 自研 | 定价引擎、风控引擎 |
信号 1:这个场景是否有 3 家以上厂商在卖成熟 SaaS? 有的话,大概率你不该自研。市面上已经有钉钉悟空、扣子、腾讯元器、字节 Coze 等多家厂商在做通用场景,同样能力自研至少 6 个月起,直接买通常 2-4 周上线。
信号 2:这个场景是否深度绑定你的业务流程? 比如你独有的价格分层、独有的合规判定规则、独有的行业术语——这些是 SaaS 不会为你单独训练的,只能自研或深度定制。
信号 3:你是否能清晰说出「和市面产品的 3 个核心差异」? 说不出的话,独特性通常不到 3 分,别自研;说得出且客户愿意为这 3 点买单,才可以考虑自研。
我们见过一家特种化工 200 人企业,最初想自研「产品咨询 Agent」,理由是「化工问答太专业,SaaS 做不了」。深聊之后发现真实差异只有「产品名字和规格不一样」,咨询逻辑和通用电商问答几乎一致。最后走通用 SaaS + 轻量知识库定制,成本从自研的 60 万降到 8 万,2 周上线。
四、维度 2:数据敏感度——越敏感越该私有化,但别一刀切
数据敏感度决定「Agent 能不能跑在 SaaS 云上」——但很多 CTO 一刀切把「所有企业数据都不能外传」,结果一头扎进自研。真实决策要按数据分级来看。
| 数据等级 | 典型示例 | 推荐部署方式 |
|---|---|---|
| L1 公开数据 | 官网、公开产品资料 | SaaS 可用 |
| L2 内部一般数据 | 内部制度、员工手册 | SaaS 或私有化 SaaS |
| L3 内部敏感数据 | 客户名单、销售数据 | 私有化部署或加密调用 |
| L4 高敏数据 | 交易明细、财务数据 | 私有化或本地部署 |
| L5 合规红线数据 | 医疗 / 金融 / 个人信息 | 强制本地化,考虑自研 |
信号 1:数据是否涉及 L4-L5? 是的话,SaaS 的公有云版基本排除,只能选私有化部署的 SaaS 或自研。
信号 2:是否有明确的合规要求(比如金融的等保三级、医疗的 HIPAA)? 是的话,必须优先考虑私有化和自研——但即使自研也需要走完整的合规审计。
信号 3:数据能否做「脱敏后调用 SaaS」? 可以的话,很多场景不需要完全私有化。比如合同审查 Agent 可以先把客户名、金额、地址脱敏,再送给 SaaS 模型审查,敏感字段保留在本地。这是一个被严重低估的路径。
我们做过一家医疗器械经销企业,最初判定「所有数据都不能外传」,后来发现只有 15% 的场景真的涉及 L4 数据,剩下 85% 可以用 SaaS。最终「85% 场景 SaaS + 15% 高敏私有化」,成本比全自研省了 60%,上线时间从 8 个月缩到 6 周。
五、维度 3:团队 AI 工程能力——有工程师不等于能做 Agent
这一维最容易误判:CTO 常常把「有 Java 团队」等同于「能做 AI Agent」,事实上 AI Agent 工程和传统软件工程是两套截然不同的方法论。判断口径是团队里有几个人具备下面这 6 项能力:
| 关键能力 | 说明 | 达标信号 |
|---|---|---|
| LLM 调用与 prompt 工程 | 熟悉不同模型的能力边界 | 独立跑通过 3+ 个模型 |
| RAG 架构设计 | 向量库选型、切片策略、检索精度调优 | 独立部署过生产级 RAG |
| Agent 编排框架 | LangGraph / LlamaIndex / 自研框架 | 独立写过多轮 Agent |
| 评测体系搭建 | 能设计场景化的评测集 | 有可量化的评测流程 |
| 私有化模型部署 | vLLM / SGLang / Ollama 生产化 | 独立部署过至少一个 |
| 数据安全与合规 | 脱敏、审计、可追溯 | 落地过合规方案 |
信号 1:团队是否有 3 人以上具备上面 6 项中的 4 项以上? 是——具备自研基础;否——建议先小步跑单个场景验证团队能力,别一上来立大项目。
信号 2:AI 工程师的稳定性如何? 市面 AI 工程师流动率极高,如果核心 1-2 个人走了项目就崩,这个团队不适合承担 6-12 个月的自研项目。
信号 3:是否有工程师之外的运营团队? AI Agent 上线后需要持续运营——扩语料、调 prompt、看 badcase、迭代评测集。没有运营团队的自研 Agent,上线 3-6 个月后效果会明显下滑。
想更系统看团队搭建节奏,可以延伸看《AI Agent 落地路线图》里的分阶段团队配置清单。
六、维度 4:预算深度——不是看前期,是看 5 年 TCO
CTO 谈预算的时候容易只看「前期一次性预算」,但 AI Agent 是长期项目,正确的口径是 5 年 TCO(Total Cost of Ownership)。下面这张是我们给客户算账的通用模板:
| 成本项 | 自研(5 年 TCO) | 买 SaaS(5 年 TCO) | 定制外包(5 年 TCO) |
|---|---|---|---|
| 前期一次性 | 80-200 万(团队工资 6-12 月) | 0-5 万(初装或数据接入) | 30-80 万(合同一次性) |
| 每年运营 | 60-120 万(团队维持 + 云资源) | 5-20 万(订阅费) | 10-30 万(维护 / 迭代合同) |
| 5 年合计 | 320-800 万 | 25-105 万 | 70-200 万 |
| 隐性成本 | 团队离职风险 / 模型换代成本 | 平台锁定 / 价格调整 | 交付方能力延续风险 |
信号 1:3-5 年 TCO 预算是否超过 200 万? 超过——自研进入可行区间;未超过——买 SaaS 或轻定制是更理性的选择。
信号 2:是否愿意每年为 Agent 保留 60 万以上的固定预算? 愿意——自研的运营能持续;不愿意——自研上线半年后就会陷入「没人维护」的僵死状态。
信号 3:预算的支出节奏? 前期紧、后期宽的公司适合 SaaS(订阅费均摊);前期宽、后期紧的公司要小心自研,别把钱全花在前期 demo 上。
想看单个场景的自研成本细账,可以对照《AI Agent 定制开发多少钱》和《AI Agent 开发成本拆解》,里面把人力、模型、数据、集成 4 块的区间都拆过。
七、维度 5:上线时效——3 个月内必须见效就别自研
时效这一维是最简单的判断题:3 个月内必须见到业务效果的场景,几乎不可能自研出稳定版本。
| 上线时效要求 | 现实可行的路径 |
|---|---|
| 2-4 周 | 只能买 SaaS,甚至无需大定制 |
| 1-3 个月 | 买 SaaS + 轻量定制 |
| 3-6 个月 | 深度定制 or 买 SaaS + 部分自研 |
| 6-12 个月 | 自研可行,但要分阶段交付 |
| 12 个月以上 | 完全自研,需要严格阶段评审 |
信号 1:业务方给的 deadline 是月还是季? 月——买;季——考虑定制;年——可以自研。
信号 2:是否有「上线时间硬约束」(比如配合大型营销活动、配合监管上线时点)? 有的话,自研的风险极高,因为 AI Agent 项目 40% 的延期率是行业常态。
信号 3:能否接受「先跑通 1 个小场景」的节奏? 能接受的话,不管走自研还是买,都建议 4 周内先出 MVP;不能接受的话,几乎只能选 SaaS。
我们观察到的规律:越是「必须尽快见效」的场景越应该买 SaaS——自研的第一个月几乎全在搭底座,SaaS 的第一个月就已经在跑真实用户了。前 3 个月的时间差在业务上通常不可逆。
八、维度 6:长期演进意愿——「先试试」不是长期战略
这一维经常被忽略,但决定了「自研版本能不能活过 18 个月」。核心问题是:企业是否把 AI 作为长期能力沉淀,还是仅仅想「先跑个项目试试」?
信号 1:公司战略层是否把 AI 明确定位为「未来 3-5 年核心能力」? 是的话——自研有战略支撑;否的话——自研会在换 CTO 或换战略时被砍掉。
信号 2:是否有明确的「AI 能力路线图」? 有——自研能沿着路线图迭代;没有——自研会在做完第 1 个场景后无以为继。
信号 3:CEO / 董事会是否理解「AI 需要长期投入」? 理解——自研有耐心;不理解——上线 6 个月看不到 ROI 就会被叫停。
「先试试」是自研最大的天敌。我们见过一家 500 人连锁企业以「先试试」启动自研,投 60 万做了 1 个营销 Agent,8 个月后效果不错但「不知道下一步做什么」,团队解散、Agent 无人维护、3 个月后停用。60 万变成纯沉没成本。
九、3 种混合方案:不是非黑即白
6 维决策不是二选一,实际上超过 70% 的企业最优解是「混合方案」——买底座 + 自研业务层、外包定制 + 内部持续迭代、SaaS + 私有化关键模块。下面这 3 种是我们近 1 年落地最多的模板。
混合方案 A:买底座 + 自研业务层
适用信号:场景独特性高(4-5 分)但团队 AI 工程能力有限(2-3 分),预算中等。
底座买成熟的 Agent 平台(钉钉悟空、扣子、Dify 等),业务层由内部团队用平台的低代码或 SDK 做自研。核心逻辑是:把「模型接入、RAG 框架、Agent 编排、监控日志」等通用能力交给平台,把「业务规则、行业语料、UI 与集成」交给自己团队。
| 分工 | 归属 | 说明 |
|---|---|---|
| 模型接入 / 编排 | 底座平台 | 复用平台能力,不重造轮子 |
| RAG 与知识库 | 底座平台 | 使用平台自带的向量库 |
| 业务规则与行业知识 | 内部团队 | 自研业务层,是护城河 |
| 与内部系统集成 | 内部团队 | 用平台 SDK 做深度对接 |
我们做过一家做工业设备的 300 人企业,走的就是这个方案——底座用悟空,业务层内部团队 2 个工程师做,3 个月上线覆盖 4 个核心场景,总投入 40 万,是全自研成本的 1/3。
混合方案 B:外包定制 + 内部持续迭代
适用信号:内部团队能力有限、场景独特性高、预算充裕、愿意长期投入。
第一年由外包厂商完成定制交付,同时在交付合同里锁定「代码、知识产权、文档、部署环境全部归甲方」,第二年起内部团队接手迭代。核心是「用外包换第 1 年的速度,用内部团队保长期演进」。
这里最容易踩的坑是「交付时没锁定知识产权」,导致第二年想内部迭代却拿不到源码。可以对照《定制软件开发合同风险条款》里的清单,签合同前把 IP 归属、部署位置、迁移协助 3 项写死。
混合方案 C:SaaS + 私有化关键模块
适用信号:数据敏感度混合(部分 L4-L5、部分 L1-L2),预算中等,希望大部分场景快速上线。
大部分低敏感场景直接用 SaaS,少量涉及高敏数据的场景做私有化部署。核心是「不为 15% 的高敏场景让 85% 的低敏场景全部背上私有化的成本」。
| 场景分层 | 部署方式 | 成本占比 |
|---|---|---|
| L1-L2 场景 | SaaS 云版本 | 15% |
| L3 场景 | 私有化 SaaS | 30% |
| L4-L5 场景 | 本地化部署 | 55% |
这个方案在医疗、金融、政务客户里落地率最高,因为它避免了「全私有化」带来的成本翻倍。
十、6 维决策自检表:可以直接打分
下面这张表把 6 维压缩成一份可以直接打分的自检清单。每维打 1-5 分(1 分为强买信号、5 分为强自研信号),加总。总分区间对应推荐决策:
| 维度 | 1 分 | 3 分 | 5 分 | 你的打分 |
|---|---|---|---|---|
| 场景独特性 | 通用场景 | 半通用 + 部分定制 | 深度绑定业务 | __ |
| 数据敏感度 | 内部知识、非敏感 | 客户数据、需脱敏 | 交易 / 医疗 / 合规红线 | __ |
| 团队 AI 工程能力 | 无稳定团队 | 有 1-2 人 | 有 3+ 人成熟团队 | __ |
| 预算深度(5 年 TCO) | <100 万 | 100-200 万 | >200 万 | __ |
| 上线时效 | 3 个月内 | 3-6 个月 | 6 个月以上 | __ |
| 长期演进意愿 | 短期项目 | 中期规划 | 长期战略 | __ |
总分对照:
- 6-12 分:强烈建议买 SaaS。自研在你的场景下是浪费钱。
- 13-18 分:建议买 SaaS + 轻量定制,或走「混合方案 C」。
- 19-24 分:建议走混合方案 A 或 B,纯自研风险仍高。
- 25-30 分:可以考虑纯自研,但仍建议 4 周 MVP、8 周评审、避免一次性大投入。
硬约束:任何一个维度打 1 分(比如「团队 AI 工程能力=1」或「上线时效=1」),无论总分多高,都建议先走 SaaS 或混合方案,别硬上自研。这一条是我们复盘过的项目里最常被违反、也最容易翻车的规则。
十一、AI Agent 项目的 4 个反直觉真相
打分只是第一步,落地时还有 4 个反直觉的真相要提前知道,很多 CTO 是踩了坑才补上这些认知的。
真相 1:自研 90% 的成本在维护,不在开发。开发一个 Agent 6 个月花 80 万,看起来是主要成本。但真实分布是:开发占 20-30%,维护占 70-80%。维护成本包括:模型换代(每 12-18 个月一次大换代)、prompt 迭代(每周至少 1 次 badcase 修复)、评测集扩充、集成系统变更适配、GPU 资源扩容。看不到这 70-80% 的公司,自研上线 12 个月后必然陷入「跑不动」的状态。
真相 2:SaaS 的灵活性被严重低估。CTO 普遍认为「SaaS 灵活性差、不能满足我们特殊需求」。真实情况是:主流 Agent SaaS 平台(悟空、扣子、Dify 等)都开放了 API、插件、SDK、Webhook,能覆盖 80% 的定制需求。只有真正涉及模型层修改、深度绕过平台机制的场景,SaaS 才不够灵活。大多数「我们要特殊定制」的需求,其实平台标准能力就能满足,只是没试。
真相 3:定制交付周期正在被工程效率提升重塑。3 年前一个中等规模的 AI Agent 定制项目要 6-9 个月,现在成熟团队做同样规模通常 2-4 个月。变化来自工程效率工具进步、通用组件成熟、行业方案沉淀。这意味着「买 SaaS 快、定制慢」的老经验正在失效,现在很多定制项目的交付速度已经追平甚至超过「SaaS + 复杂配置」。判断项目周期要看交付方最近 12 个月的实际节奏,不能套 3 年前的经验。
真相 4:大模型换代风险两边都躲不掉。CTO 常常担心「自研会被模型换代坑」,其实买 SaaS 也躲不掉——SaaS 厂商换底层模型时,你的 prompt、评测集、业务逻辑可能都要重跑一遍。区别是:自研的换代成本你自己扛,SaaS 由厂商扛但你要接受可能的效果波动。这不是自研 vs 买的决胜维度,只是要提前预留 10-20% 的年度预算做换代适配。
写在最后
回到开头那家 300 人制造企业 CIO 的故事。他事后复盘时给自己列了 5 条铁律,我们觉得写得比我们自己总结的还准:通用场景优先买、独特场景才自研;6 维打分 <18 别硬上自研;4 周出不了 MVP 就喊停;每 8 周做一次「继续 / 收缩 / 停」评审;把 5 年 TCO 算完再签合同,别只看第一年。
自研和买 SaaS 不是意识形态之争,是一次真金白银的技术投资决策。这一步做对,后面每一步都在为你省钱;做错,后面每一步都在为这个错误买单。如果你正在做 AI Agent 的自研 vs 买评估,欢迎把候选场景、团队能力、预算、时效整理成一张清单,我们可以一起用这份 6 维矩阵过一遍,看看每个场景该落到哪个象限、哪些能立即启动、哪些要先修完前提再做。








