开沿科技
13305079753想要报价 · 5 道题
方法论与思考

AI Agent 什么时候该自研 / 什么时候该买?6 维决策矩阵

开沿研发中心·2026-07-05·21 分钟阅读
AI Agent 什么时候该自研 / 什么时候该买?6 维决策矩阵

某 300 人规模的机械制造企业,CIO 上个月带着一份「AI 客服自研方案」来找我们复盘。他去年拉了 3 个 AI 工程师,规划 6 个月做完一个内部客服 Agent,预算 80 万人力工资。结果半年过去,Agent 还停在「本地跑通了一个 demo」的状态——原因不是团队不行,而是他们把 60% 的时间花在了「搭底座、选模型、写 RAG 框架、做 UI」上。最后 CIO 花 8 万签了一年现成 SaaS,2 周上线,效果比自研版还稳。他跟我们说了一句:「我一直以为自研更划算,账算完才发现是把'省下的授权费'扔进了工资池。」

这不是个案。AI Agent 项目里最贵的决策,不是选哪家模型、也不是选哪个框架,而是「这个场景到底该自研还是该买」——这一步错了,后面每一步都在为它买单。这篇给一份 6 维决策矩阵,把这一步一次说清:什么信号该自研、什么信号该买、什么情况该混着来,最后给一份能直接打分的自检表。

一、为什么「自研更划算」总是听起来划算,真做起来贵

先说清一件事:绝大多数企业 CTO 第一次算「自研 vs 买」的账时,都会犯 3 个财务假账,导致自研的账面成本被系统性低估。这 3 个假账不修正,后面 6 维矩阵怎么算都是错的。

第 1 个假账:只算工程师工资,不算团队维护成本。CTO 算账通常是「3 个人 × 6 个月 = 18 人月」,按 3 万月薪算是 54 万。但真实成本还要加上:招聘成本(AI 工程师市面平均猎头费 3-6 万一人)、期权稀释、社保和奖金约 30% 溢价、以及最重要的——上线后每年的维护人力(通常是自研成本的 40-60%)。把这几项加齐,54 万的账面成本实际是 90-120 万,第 2 年还要继续付 40-60 万维护。

第 2 个假账:把「大模型 API 费用」当成唯一线上成本。这是最烧钱的一个假账。自研 AI Agent 上线后,除了模型调用费,还有向量库托管、日志和监控存储、GPU 推理机器(如果跑私有化模型)、以及安全审计合规成本。我们见过一家 400 人企业,自研的知识问答 Agent 上线 9 个月,模型 API 只花了 3 万,向量库和 GPU 加起来花了 22 万,这个比例在自研项目里是常态。

第 3 个假账:忽略时间和机会成本。团队花 6-9 个月自研一个通用场景,同期竞争对手可能已经买了 SaaS、在第 3 个月就用起来了。这 6 个月的时间差不出现在任何一张 P&L 表上,但在快速迭代型行业里就是致命的。

三个假账修正完,很多原来「自研省钱」的场景会变成「自研贵 2-3 倍」。真实决策要基于修正后的账。

二、6 维决策矩阵总表:把 6 个维度钉在一张表里

自研 vs 买的核心决策维度只有 6 个:场景独特性、数据敏感度、团队 AI 工程能力、预算深度、上线时效、长期演进意愿。任何一维打出「强自研信号」并不代表要自研,需要 6 维综合打分,下面这张是我们给客户做「自研 vs 买」诊断时反复打磨出来的对照表:

维度 强自研信号 强买 SaaS 信号 常见误判
场景独特性 深度绑定业务流程,市面无对应产品 通用场景(问答/纪要/客服) 把「我们做法不一样」当独特性
数据敏感度 涉及交易 / 医疗 / 合规红线数据 内部知识、非敏感业务数据 把「所有数据都不能外传」一刀切
团队 AI 工程能力 有 3+ 人稳定 AI 工程经验 无稳定团队或人员流动大 把「有工程师」等同于「能做 Agent」
预算深度 3 年 TCO 预算充裕(>200 万) 前期预算紧、每年订阅可接受 只算前期不算 3-5 年 TCO
上线时效 允许 4-6 个月以上迭代 3 个月内必须见效 高估自研的迭代速度
长期演进意愿 战略上把 AI 定为长期能力 短期项目 / 一次性场景 把「先试试」当长期战略

这张表用 3 步:第 1 步把待评估的场景在每个维度上落一个位置(1-5 分,1 分为强买、5 分为强自研);第 2 步算 6 维总分;第 3 步落到决策象限。总分 24 分以上强烈建议自研或深度定制,12 分以下建议买 SaaS,12-24 分之间是混合方案区间——这个区间是大多数企业实际的落点。

三、维度 1:场景独特性——越通用越该买,越独特越该自研

场景独特性是 6 维里权重最高的一维,判断口径是:「同样的场景,你和你竞争对手的做法差多少」。如果差异不到 20%,几乎肯定该买;如果差异超过 60%,几乎肯定要自研或定制。

场景类型 独特性打分 推荐路径 典型案例
内部知识问答 1-2 分 买 SaaS 员工手册问答、政策查询
会议纪要 / 转录 1-2 分 买 SaaS 通用会议整理、语音转文字
通用客服话术 2-3 分 买 SaaS + 轻定制 电商咨询、售后应答
销售线索初筛 3-4 分 定制开发 结合企业 CRM 打分模型
行业专家型 Agent 4-5 分 深度定制 / 自研 法律合同审查、医疗辅助
业务核心决策 Agent 5 分 自研 定价引擎、风控引擎

信号 1:这个场景是否有 3 家以上厂商在卖成熟 SaaS? 有的话,大概率你不该自研。市面上已经有钉钉悟空、扣子、腾讯元器、字节 Coze 等多家厂商在做通用场景,同样能力自研至少 6 个月起,直接买通常 2-4 周上线。

信号 2:这个场景是否深度绑定你的业务流程? 比如你独有的价格分层、独有的合规判定规则、独有的行业术语——这些是 SaaS 不会为你单独训练的,只能自研或深度定制。

信号 3:你是否能清晰说出「和市面产品的 3 个核心差异」? 说不出的话,独特性通常不到 3 分,别自研;说得出且客户愿意为这 3 点买单,才可以考虑自研。

我们见过一家特种化工 200 人企业,最初想自研「产品咨询 Agent」,理由是「化工问答太专业,SaaS 做不了」。深聊之后发现真实差异只有「产品名字和规格不一样」,咨询逻辑和通用电商问答几乎一致。最后走通用 SaaS + 轻量知识库定制,成本从自研的 60 万降到 8 万,2 周上线。

四、维度 2:数据敏感度——越敏感越该私有化,但别一刀切

数据敏感度决定「Agent 能不能跑在 SaaS 云上」——但很多 CTO 一刀切把「所有企业数据都不能外传」,结果一头扎进自研。真实决策要按数据分级来看。

数据等级 典型示例 推荐部署方式
L1 公开数据 官网、公开产品资料 SaaS 可用
L2 内部一般数据 内部制度、员工手册 SaaS 或私有化 SaaS
L3 内部敏感数据 客户名单、销售数据 私有化部署或加密调用
L4 高敏数据 交易明细、财务数据 私有化或本地部署
L5 合规红线数据 医疗 / 金融 / 个人信息 强制本地化,考虑自研

信号 1:数据是否涉及 L4-L5? 是的话,SaaS 的公有云版基本排除,只能选私有化部署的 SaaS 或自研。

信号 2:是否有明确的合规要求(比如金融的等保三级、医疗的 HIPAA)? 是的话,必须优先考虑私有化和自研——但即使自研也需要走完整的合规审计。

信号 3:数据能否做「脱敏后调用 SaaS」? 可以的话,很多场景不需要完全私有化。比如合同审查 Agent 可以先把客户名、金额、地址脱敏,再送给 SaaS 模型审查,敏感字段保留在本地。这是一个被严重低估的路径。

我们做过一家医疗器械经销企业,最初判定「所有数据都不能外传」,后来发现只有 15% 的场景真的涉及 L4 数据,剩下 85% 可以用 SaaS。最终「85% 场景 SaaS + 15% 高敏私有化」,成本比全自研省了 60%,上线时间从 8 个月缩到 6 周。

五、维度 3:团队 AI 工程能力——有工程师不等于能做 Agent

这一维最容易误判:CTO 常常把「有 Java 团队」等同于「能做 AI Agent」,事实上 AI Agent 工程和传统软件工程是两套截然不同的方法论。判断口径是团队里有几个人具备下面这 6 项能力:

关键能力 说明 达标信号
LLM 调用与 prompt 工程 熟悉不同模型的能力边界 独立跑通过 3+ 个模型
RAG 架构设计 向量库选型、切片策略、检索精度调优 独立部署过生产级 RAG
Agent 编排框架 LangGraph / LlamaIndex / 自研框架 独立写过多轮 Agent
评测体系搭建 能设计场景化的评测集 有可量化的评测流程
私有化模型部署 vLLM / SGLang / Ollama 生产化 独立部署过至少一个
数据安全与合规 脱敏、审计、可追溯 落地过合规方案

信号 1:团队是否有 3 人以上具备上面 6 项中的 4 项以上? 是——具备自研基础;否——建议先小步跑单个场景验证团队能力,别一上来立大项目。

信号 2:AI 工程师的稳定性如何? 市面 AI 工程师流动率极高,如果核心 1-2 个人走了项目就崩,这个团队不适合承担 6-12 个月的自研项目。

信号 3:是否有工程师之外的运营团队? AI Agent 上线后需要持续运营——扩语料、调 prompt、看 badcase、迭代评测集。没有运营团队的自研 Agent,上线 3-6 个月后效果会明显下滑。

想更系统看团队搭建节奏,可以延伸看《AI Agent 落地路线图》里的分阶段团队配置清单。

六、维度 4:预算深度——不是看前期,是看 5 年 TCO

CTO 谈预算的时候容易只看「前期一次性预算」,但 AI Agent 是长期项目,正确的口径是 5 年 TCO(Total Cost of Ownership)。下面这张是我们给客户算账的通用模板:

成本项 自研(5 年 TCO) 买 SaaS(5 年 TCO) 定制外包(5 年 TCO)
前期一次性 80-200 万(团队工资 6-12 月) 0-5 万(初装或数据接入) 30-80 万(合同一次性)
每年运营 60-120 万(团队维持 + 云资源) 5-20 万(订阅费) 10-30 万(维护 / 迭代合同)
5 年合计 320-800 万 25-105 万 70-200 万
隐性成本 团队离职风险 / 模型换代成本 平台锁定 / 价格调整 交付方能力延续风险

信号 1:3-5 年 TCO 预算是否超过 200 万? 超过——自研进入可行区间;未超过——买 SaaS 或轻定制是更理性的选择。

信号 2:是否愿意每年为 Agent 保留 60 万以上的固定预算? 愿意——自研的运营能持续;不愿意——自研上线半年后就会陷入「没人维护」的僵死状态。

信号 3:预算的支出节奏? 前期紧、后期宽的公司适合 SaaS(订阅费均摊);前期宽、后期紧的公司要小心自研,别把钱全花在前期 demo 上。

想看单个场景的自研成本细账,可以对照《AI Agent 定制开发多少钱》《AI Agent 开发成本拆解》,里面把人力、模型、数据、集成 4 块的区间都拆过。

七、维度 5:上线时效——3 个月内必须见效就别自研

时效这一维是最简单的判断题:3 个月内必须见到业务效果的场景,几乎不可能自研出稳定版本。

上线时效要求 现实可行的路径
2-4 周 只能买 SaaS,甚至无需大定制
1-3 个月 买 SaaS + 轻量定制
3-6 个月 深度定制 or 买 SaaS + 部分自研
6-12 个月 自研可行,但要分阶段交付
12 个月以上 完全自研,需要严格阶段评审

信号 1:业务方给的 deadline 是月还是季? 月——买;季——考虑定制;年——可以自研。

信号 2:是否有「上线时间硬约束」(比如配合大型营销活动、配合监管上线时点)? 有的话,自研的风险极高,因为 AI Agent 项目 40% 的延期率是行业常态。

信号 3:能否接受「先跑通 1 个小场景」的节奏? 能接受的话,不管走自研还是买,都建议 4 周内先出 MVP;不能接受的话,几乎只能选 SaaS。

我们观察到的规律:越是「必须尽快见效」的场景越应该买 SaaS——自研的第一个月几乎全在搭底座,SaaS 的第一个月就已经在跑真实用户了。前 3 个月的时间差在业务上通常不可逆。

八、维度 6:长期演进意愿——「先试试」不是长期战略

这一维经常被忽略,但决定了「自研版本能不能活过 18 个月」。核心问题是:企业是否把 AI 作为长期能力沉淀,还是仅仅想「先跑个项目试试」?

信号 1:公司战略层是否把 AI 明确定位为「未来 3-5 年核心能力」? 是的话——自研有战略支撑;否的话——自研会在换 CTO 或换战略时被砍掉。

信号 2:是否有明确的「AI 能力路线图」? 有——自研能沿着路线图迭代;没有——自研会在做完第 1 个场景后无以为继。

信号 3:CEO / 董事会是否理解「AI 需要长期投入」? 理解——自研有耐心;不理解——上线 6 个月看不到 ROI 就会被叫停。

「先试试」是自研最大的天敌。我们见过一家 500 人连锁企业以「先试试」启动自研,投 60 万做了 1 个营销 Agent,8 个月后效果不错但「不知道下一步做什么」,团队解散、Agent 无人维护、3 个月后停用。60 万变成纯沉没成本。

九、3 种混合方案:不是非黑即白

6 维决策不是二选一,实际上超过 70% 的企业最优解是「混合方案」——买底座 + 自研业务层、外包定制 + 内部持续迭代、SaaS + 私有化关键模块。下面这 3 种是我们近 1 年落地最多的模板。

混合方案 A:买底座 + 自研业务层

适用信号:场景独特性高(4-5 分)但团队 AI 工程能力有限(2-3 分),预算中等。

底座买成熟的 Agent 平台(钉钉悟空、扣子、Dify 等),业务层由内部团队用平台的低代码或 SDK 做自研。核心逻辑是:把「模型接入、RAG 框架、Agent 编排、监控日志」等通用能力交给平台,把「业务规则、行业语料、UI 与集成」交给自己团队。

分工 归属 说明
模型接入 / 编排 底座平台 复用平台能力,不重造轮子
RAG 与知识库 底座平台 使用平台自带的向量库
业务规则与行业知识 内部团队 自研业务层,是护城河
与内部系统集成 内部团队 用平台 SDK 做深度对接

我们做过一家做工业设备的 300 人企业,走的就是这个方案——底座用悟空,业务层内部团队 2 个工程师做,3 个月上线覆盖 4 个核心场景,总投入 40 万,是全自研成本的 1/3。

混合方案 B:外包定制 + 内部持续迭代

适用信号:内部团队能力有限、场景独特性高、预算充裕、愿意长期投入。

第一年由外包厂商完成定制交付,同时在交付合同里锁定「代码、知识产权、文档、部署环境全部归甲方」,第二年起内部团队接手迭代。核心是「用外包换第 1 年的速度,用内部团队保长期演进」。

这里最容易踩的坑是「交付时没锁定知识产权」,导致第二年想内部迭代却拿不到源码。可以对照《定制软件开发合同风险条款》里的清单,签合同前把 IP 归属、部署位置、迁移协助 3 项写死。

混合方案 C:SaaS + 私有化关键模块

适用信号:数据敏感度混合(部分 L4-L5、部分 L1-L2),预算中等,希望大部分场景快速上线。

大部分低敏感场景直接用 SaaS,少量涉及高敏数据的场景做私有化部署。核心是「不为 15% 的高敏场景让 85% 的低敏场景全部背上私有化的成本」。

场景分层 部署方式 成本占比
L1-L2 场景 SaaS 云版本 15%
L3 场景 私有化 SaaS 30%
L4-L5 场景 本地化部署 55%

这个方案在医疗、金融、政务客户里落地率最高,因为它避免了「全私有化」带来的成本翻倍。

十、6 维决策自检表:可以直接打分

下面这张表把 6 维压缩成一份可以直接打分的自检清单。每维打 1-5 分(1 分为强买信号、5 分为强自研信号),加总。总分区间对应推荐决策:

维度 1 分 3 分 5 分 你的打分
场景独特性 通用场景 半通用 + 部分定制 深度绑定业务 __
数据敏感度 内部知识、非敏感 客户数据、需脱敏 交易 / 医疗 / 合规红线 __
团队 AI 工程能力 无稳定团队 有 1-2 人 有 3+ 人成熟团队 __
预算深度(5 年 TCO) <100 万 100-200 万 >200 万 __
上线时效 3 个月内 3-6 个月 6 个月以上 __
长期演进意愿 短期项目 中期规划 长期战略 __

总分对照

  • 6-12 分:强烈建议买 SaaS。自研在你的场景下是浪费钱。
  • 13-18 分:建议买 SaaS + 轻量定制,或走「混合方案 C」。
  • 19-24 分:建议走混合方案 A 或 B,纯自研风险仍高。
  • 25-30 分:可以考虑纯自研,但仍建议 4 周 MVP、8 周评审、避免一次性大投入。

硬约束:任何一个维度打 1 分(比如「团队 AI 工程能力=1」或「上线时效=1」),无论总分多高,都建议先走 SaaS 或混合方案,别硬上自研。这一条是我们复盘过的项目里最常被违反、也最容易翻车的规则。

十一、AI Agent 项目的 4 个反直觉真相

打分只是第一步,落地时还有 4 个反直觉的真相要提前知道,很多 CTO 是踩了坑才补上这些认知的。

真相 1:自研 90% 的成本在维护,不在开发。开发一个 Agent 6 个月花 80 万,看起来是主要成本。但真实分布是:开发占 20-30%,维护占 70-80%。维护成本包括:模型换代(每 12-18 个月一次大换代)、prompt 迭代(每周至少 1 次 badcase 修复)、评测集扩充、集成系统变更适配、GPU 资源扩容。看不到这 70-80% 的公司,自研上线 12 个月后必然陷入「跑不动」的状态。

真相 2:SaaS 的灵活性被严重低估。CTO 普遍认为「SaaS 灵活性差、不能满足我们特殊需求」。真实情况是:主流 Agent SaaS 平台(悟空、扣子、Dify 等)都开放了 API、插件、SDK、Webhook,能覆盖 80% 的定制需求。只有真正涉及模型层修改、深度绕过平台机制的场景,SaaS 才不够灵活。大多数「我们要特殊定制」的需求,其实平台标准能力就能满足,只是没试。

真相 3:定制交付周期正在被工程效率提升重塑。3 年前一个中等规模的 AI Agent 定制项目要 6-9 个月,现在成熟团队做同样规模通常 2-4 个月。变化来自工程效率工具进步、通用组件成熟、行业方案沉淀。这意味着「买 SaaS 快、定制慢」的老经验正在失效,现在很多定制项目的交付速度已经追平甚至超过「SaaS + 复杂配置」。判断项目周期要看交付方最近 12 个月的实际节奏,不能套 3 年前的经验。

真相 4:大模型换代风险两边都躲不掉。CTO 常常担心「自研会被模型换代坑」,其实买 SaaS 也躲不掉——SaaS 厂商换底层模型时,你的 prompt、评测集、业务逻辑可能都要重跑一遍。区别是:自研的换代成本你自己扛,SaaS 由厂商扛但你要接受可能的效果波动。这不是自研 vs 买的决胜维度,只是要提前预留 10-20% 的年度预算做换代适配。

写在最后

回到开头那家 300 人制造企业 CIO 的故事。他事后复盘时给自己列了 5 条铁律,我们觉得写得比我们自己总结的还准:通用场景优先买、独特场景才自研;6 维打分 <18 别硬上自研;4 周出不了 MVP 就喊停;每 8 周做一次「继续 / 收缩 / 停」评审;把 5 年 TCO 算完再签合同,别只看第一年

自研和买 SaaS 不是意识形态之争,是一次真金白银的技术投资决策。这一步做对,后面每一步都在为你省钱;做错,后面每一步都在为这个错误买单。如果你正在做 AI Agent 的自研 vs 买评估,欢迎把候选场景、团队能力、预算、时效整理成一张清单,我们可以一起用这份 6 维矩阵过一遍,看看每个场景该落到哪个象限、哪些能立即启动、哪些要先修完前提再做。

常见问题

基于这个话题最常被问到的 4 个具体问题

Q1. 我们已经有 AI 工程师团队还需要买 SaaS 吗?

有团队不等于什么都该自研,判断口径是「这个场景是不是你的业务护城河」。如果是通用型场景,比如内部知识问答、会议纪要、客服话术辅助,市面上成熟 SaaS 单价通常低于自研 1 年的人力工资,团队应该拿去做真正差异化的场景。如果是你的业务护城河,比如你独有的定价引擎、你自己积累的行业语料,才值得自研。我们见过的一个典型误区:团队被养出来后为了「不闲着」,把所有场景都自研,结果 3 个场景做了 18 个月都没上线,同期 3 个场景买 SaaS 只要 3 个月。团队要留给真正的护城河场景。

Q2. 自研 AI Agent 半年才能上线是不是太慢了?

这个「半年」要看是什么场景。如果是通用场景(知识问答、纪要总结)确实太慢,市面上成熟 SaaS 2-4 周就能开箱用。如果是深度业务定制场景(比如带 10 个内部系统集成的 Agent),6 个月不算慢,但要看这 6 个月里有没有阶段性产出:第 4 周应该有一个可 demo 的 MVP,第 8 周应该有第一批真实用户在用,第 12 周应该有可量化的指标。如果 6 个月都在「打基础、搭底座、调模型」,一个真实场景都没跑起来,就是节奏出问题了。判断标准很简单:每 4 周问一次「上周有几个真实用户用了」,答不上来就是慢。

Q3. 定制外包和「买 SaaS」到底差在哪?

差在「谁承担长期演进」。买 SaaS 的核心是把模型换代、能力升级、平台运维长期外包给厂商,你付订阅费换取「不用操心底层」。定制外包是买断一次交付,之后的模型换代、bug 修复、能力扩展要重新签合同或自建团队。SaaS 灵活性看似低,但厂商每 3-6 个月的版本更新其实覆盖了 80% 的通用需求;定制交付看似灵活,但 12 个月后想加一个新能力,往往发现原来的架构支撑不了、要推倒一部分重来。判断口径:这个场景 3 年内需求会大变还是小变?大变买 SaaS 或选可扩展定制方案,小变可以定制外包。

Q4. AI Agent 项目的沉没成本怎么控?

3 条硬规矩。第一条,前 4 周必须出可 demo 的 MVP,超时喊停复盘架构;第二条,每 8 周做一次「继续 / 收缩 / 停」评审,看真实用户数和使用频次,答不上来就砍;第三条,任何超过总预算 30% 的追加投入必须走「新立项」流程,不能顺着老账继续加。沉没成本失控最典型的场景是「已经投了这么多,再加一点点就能好」——这句话出现 3 次以上,基本就是要凉的信号。我们见过的止损做法:把已投入部分砍成「已交付的 3 个小场景」并快速上线锁定价值,剩下的场景重新招标或改买 SaaS,损失能控制在 40% 以内。

开沿研发中心

开沿研发中心

开沿科技的方法论与技术团队,把一线交付中的经验沉淀成可复用的方法。了解研发中心 →

4
专注企业数字化
2000+ 家
服务企业
1000+ 个
交付项目
钉钉认证
官方认证服务商
+ 顺手带走
没准备好开聊?先把这份 PDF 拿走自己看——无需留联系方式、点开即下
下载 定制软件预算分档参考
把账算清楚

想让人帮你看看这份报价是不是合理

你手里如果已经有 1-3 份报价单,发我们核一下——半小时给你一份「合不合理 / 哪里可能藏坑 / 我们这套方法对照」的口头反馈——免费,不强推。

看公开报价区间