某 300 人医疗器械公司的 CTO 最近被老板问了一个问题:「听说现在 AI Agent 很火,咱们也搞一个,预算大概要多少?」他翻了一圈三家方案商的报价单,从 18 万到 240 万都有,差了一个数量级。更让他头疼的是,三份报价里写的工作内容看起来差不多,都是「智能客服 + 业务分析 + 自动化流程」三件套,但谁也没说清楚这个钱花在了哪儿。这种「同样的标签、十倍的报价」并不少见。AI Agent 不是一锤子买卖,它是一条从 POC 到生产再到长期运维的成本曲线,老板要先看懂结构,再谈数字。
这篇文章的目标,是帮要拍板做 AI Agent 的老板和 CTO 把账本拆开。不去讲玄乎的「AI 能改变一切」,只拆四块大头费用 + 一块持续性运维,配上 5 人、100 人、300 人、千人四档企业的盘子区间,让你在签字之前心里有数:这笔钱花在哪、花得值不值、有没有可能用 AI Coding 把账重新写一遍。
一、AI Agent 的费用结构和传统软件不一样
传统软件项目的费用结构相对线性:需求 → 设计 → 开发 → 测试 → 部署 → 运维,每一段对应明确的人天和价格。AI Agent 的费用结构却更像一棵树,分四块主干 + 一块持续浇水:
| 费用块 | 占比经验值 | 是否一次性 | 容易被忽视的程度 |
|---|---|---|---|
| POC 验证 | 5%-15% | 一次性 | 低 |
| 模型与算力 | 15%-30% | 持续性 | 中 |
| 工程定制(数据接入/权限/工具链/审计) | 30%-45% | 一次性为主 | 中 |
| 数据准备(知识库/口径治理) | 15%-30% | 一次性 + 持续追加 | 高 |
| 持续性运维(监控/调优/扩展) | 年度 15%-25% 追加 | 持续性 | 高 |
为什么和传统软件不一样?三个原因。第一,模型本身在变,今天调通的 Prompt 半年后可能不灵;第二,数据是 AI Agent 的燃料,没有数据治理就没有效果,但治理工作往往没人愿意单独立项;第三,AI Agent 上线只是开始,新场景、新角色、新合规要求会不断追加,运维不是「修 bug」而是「持续养」。这三个特性决定了:你不能用做 ERP 的思路做 AI Agent,否则要么预算超支,要么效果落空。
如果你还在评估要不要立项,可以先看一眼 AI Agent 落地路线图,确认场景是否真的具备启动条件,再来谈预算。
二、POC 阶段:1-3 万和 5-10 万分别能验证什么
POC 是花小钱办大事的环节。但 POC 的预算定多少,决定了你能验证什么级别的假设。把 POC 当成「先做个 Demo 给老板看」,多半会两头落空。
1-3 万级别的 POC,能跑通的是「单场景 + 模拟数据 + 内部 1-2 个角色用」。比如做一个「财务费用单审批助手」,给定一批历史报销单,让 Agent 判断哪些违反差旅政策、给出复核建议。这个量级的 POC 能验证两件事:模型能不能听懂你的业务语言,规则能不能用自然语言表达清楚。但它验证不了:高并发下的稳定性、复杂权限隔离、跨系统数据一致性。
5-10 万级别的 POC,能跑通的是「2-3 个关联场景 + 真实数据脱敏 + 小范围真人试用」。比如同样是费用助手,但接入了真实差旅历史、关联了 OA 审批流、让 5 个业务员试用 2 周。这个量级能多验证三件事:真实数据的脏乱程度、真实用户的使用习惯、跨系统接口的稳定性。
| POC 预算档 | 验证范围 | 典型周期 | 适合判断的问题 |
|---|---|---|---|
| 1-3 万 | 单场景 + 模拟数据 | 2-3 周 | 业务规则是否能 Prompt 化 |
| 3-5 万 | 单场景 + 真实数据 | 3-5 周 | 数据治理工作量初估 |
| 5-10 万 | 2-3 场景 + 真人试用 | 6-8 周 | 用户接受度 + 系统集成可行性 |
| 10 万+ | 多角色 + 多系统 | 8-12 周 | 接近生产形态的全链路验证 |
我们见过最常见的失败 POC 是这样的:预算 2 万、想验证 5 个场景、还要求带前端界面、还要 SSO 登录、还要导出报表。结果做出来什么都像、什么都不能用。POC 阶段的关键是「砍场景而不是砍预算」,把一个场景做透,比五个场景都做半截更能帮你判断要不要继续投。
三、产品化与生产:四类工程工作的人天构成
POC 验证通过之后,从 Demo 到真上线之间,藏着大量被低估的工程工作。这一块通常占总预算的 30%-45%,分四类:
第一类:数据接入。 把 Agent 接到企业真实的业务系统上。订单数据在 ERP、客户档案在 CRM、审批流在 OA、文档在网盘、聊天记录在 IM。每一个数据源都要做对接、字段映射、增量同步、错误回滚。一个中等复杂度的企业,光数据接入就要 30-80 人天。具体打法可以参考 钉钉数据同步架构 这篇里的拆解思路。
第二类:权限对齐。 AI Agent 是「会主动调接口的程序」,权限边界比传统软件更复杂。销售 A 能不能看到销售 B 的客户?财务能不能看到工资单?老板的 Agent 该不该看到所有人的聊天记录?这些边界要在工程里一条条对齐、测试、留痕。权限做得粗,合规风险大;做得细,开发量翻倍。这一块通常 20-50 人天。
第三类:工具链建设。 Agent 不只是聊天框,它要能调用工具:查库存、发邮件、建审批单、生成报表。每一个工具都要写适配器、定义参数、做容错。一个生产级 Agent 通常需要 15-30 个工具,每个工具 1-2 人天,合计 30-60 人天。
第四类:留痕与审计。 Agent 做了什么决策、用了什么数据、给了什么答复,都要可追溯、可复盘、可追责。这一块涉及日志结构、Trace ID 串联、敏感数据脱敏、合规报表,通常占 15-30 人天。关于 Agent 的数据安全规则,建议结合 AI Agent 数据安全实操 一起评估。
| 工程工作类别 | 人天区间 | 单价参考(8000-15000 元/人天) | 工作量占比 |
|---|---|---|---|
| 数据接入 | 30-80 | 24-120 万 | 25%-35% |
| 权限对齐 | 20-50 | 16-75 万 | 15%-25% |
| 工具链建设 | 30-60 | 24-90 万 | 20%-30% |
| 留痕审计 | 15-30 | 12-45 万 | 10%-15% |
把这四类加起来,一个中等复杂度的生产化项目,纯工程定制部分通常落在 100-220 万区间。这个数字会让很多老板倒吸一口气,但它确实是 AI Agent「不是聊天框、而是会干活的同事」的真实代价。
四、模型与算力:三种主流路线的成本曲线
这是大家最关心、也最容易拍脑袋的一块。目前主流三条路线,成本曲线完全不同:
路线一:Token 计费。 按调用量付钱,主流大模型 API 都走这个。优点是起步零门槛、按需付费;缺点是用量上去之后单价没有谈判空间,且复杂任务一次调用消耗 Token 可能比想象的高很多。日均 1000 次以下的小场景,月费可能就几百到几千;但日均 10 万次的高频场景,月费很容易飙到 5-10 万。
路线二:包月/包年套餐。 国内外几家大模型厂商都开始推企业套餐,按账号数或固定额度计费。优点是单价比 Token 计费便宜 30%-50%,可预算;缺点是有额度上限,超出之后还是按 Token 算,且需要提前判断用量。
路线三:私有化部署。 自己买卡、装开源模型、本地推理。优点是数据不出域、长期边际成本低、合规优势明显;缺点是前期投入大(一台 A800 服务器轻松 50 万起)、运维门槛高、模型升级要自己跟。300 人以上、对数据合规要求高的企业才有性价比。
| 路线 | 起步成本 | 月度变动成本 | 适合规模 | 主要风险 |
|---|---|---|---|---|
| Token 计费 | 几乎为 0 | 与用量线性 | 5-100 人 | 用量爆发后单价无谈判力 |
| 包月套餐 | 数千元 | 相对稳定 | 50-500 人 | 用量预估偏差风险 |
| 私有化部署 | 50-200 万 | 电费 + 运维 | 300 人以上 | 模型迭代落后、运维负担 |
实战建议:先 Token 计费跑 2-3 个月,拿到真实用量曲线,再决定要不要切包月或者部署私有模型。直接上私有化,结果发现用量根本撑不满一台 A800 的项目,我们见过不止一个。这一块跟 企业 AI 成本失控 那篇里讲的「拍脑袋买卡」是同一个雷。
五、数据准备:被严重低估的隐藏支出
如果说前面四块还能在合同里写明白,数据准备这块往往就是预算外的「黑洞」。它分三段:
知识库整理。 公司的 SOP、产品手册、政策文件、FAQ、培训资料,散落在网盘、邮件、群文件、个人电脑里。要变成 Agent 能用的知识库,需要清洗、去重、加结构化标签、版本对齐。一家 100 人的公司,知识库整理通常要 20-40 人天,且要业务专家配合,不是开发能独立完成的。
口径治理。 「客户」「订单」「成交」这些词在销售、财务、供应链口中含义往往不同。Agent 要给出一致的答复,必须先把口径定义清楚。这一块通常要业务负责人 + 数据工程师一起做工作坊,10-30 人天起。
数据接入与脱敏。 涉及到合规的数据,要做脱敏、加密、访问审计。这一块跟前面工程定制里的「数据接入」有重叠,但更偏数据治理而不是 API 对接,通常 15-40 人天。
数据准备这块经常被低估的根本原因,是它分散在业务部门头上,预算不好统一报;而且很多老板觉得「我们公司有数据啊」,没想到数据可用和数据能喂给 Agent 是两回事。这块跟 数据迁移踩坑指南 提到的「以为有数据等于数据可用」是一个雷。
我们的经验:数据准备如果占项目预算不到 20%,要么是省略了这一步(后面会出问题),要么是项目场景特别简单(少见)。
六、持续性运维:上线只是开始
AI Agent 上线后,每年还会持续吃掉一笔运维费。这笔钱分四块:
| 运维类别 | 年度费用区间 | 触发节奏 |
|---|---|---|
| 模型 API/算力 | 按用量持续 | 月度 |
| 监控告警 + 异常处理 | 工程定制费的 15%-20% | 季度复盘 |
| 调优与新场景扩展 | 初期建设费的 20%-30% | 半年迭代 |
| 模型升级与重训 | 视场景而定 | 年度 |
监控告警 包括:Agent 答错率监控、调用失败重试、敏感词命中拦截。这部分没人盯,半年后就成「能跑但效果越来越差」的状态。
调优与新场景扩展 是 AI Agent 区别于传统软件的关键特征。传统软件上线后是「维护」,AI Agent 上线后是「持续养」。新场景、新角色、新规则会不断追加,每追加一个就要 5-15 人天。
模型升级 最容易被忽视。今年用某个模型调通的 Prompt,明年模型升级后可能要全部重写。这不是 bug,是 AI 项目的固有节奏,要在预算里留出来。
参考 企业 AI Agent 综合成本 那篇里的长期账,运维费每年会吃掉初期投入的 20%-35%。如果一开始没把这笔留出来,第二年就会出现「上线了但没人管,效果掉下来没人管」的尴尬局面。
七、四档企业的全年总盘子区间
把上面五块加起来,按企业规模分四档,给一个全年总盘子的参考区间(含初期建设 + 第一年运维):
| 企业规模 | 典型场景 | 全年总盘子区间 | 主要构成 |
|---|---|---|---|
| 5-50 人小厂 | 1-2 个轻量场景(销售助手 / 客服答疑) | 5-25 万 | Token 费 + 轻定制 |
| 50-200 人中企 | 3-5 个中等场景(含数据分析 / 审批助手) | 30-120 万 | 工程定制为主 |
| 200-500 人企业 | 5-10 个场景 + 跨系统集成 | 150-500 万 | 数据治理 + 工程定制 |
| 1000 人以上集团 | 全员 + 多 BU + 合规部署 | 500-2000 万 | 私有化部署 + 持续运维 |
这个区间看起来很宽,是因为同样规模的企业,做的深浅差异巨大。一家 200 人公司只做一个销售跟单助手,可能 30 万就搞定;同样 200 人的公司要做财务 + 业务 + 客服 + HR 四条线全覆盖,500 万都未必够。判断你应该落在哪一档,关键看「场景数 × 集成深度」两个维度。
如果你是 50-200 人的中型企业,建议先看 AI Agent 立项前自检 这篇,确认场景是否值得做、数据是否够用,再来填这个表。
八、AI Coding 怎么改写这笔账
最后聊一个变量:AI Coding。
过去三年,工程定制费之所以贵,是因为「人天 × 单价」的乘法。一个生产级 Agent 要 150-220 人天,单价 1 万左右,光工程就是 150-220 万。AI Coding 的出现,正在把这个乘法里的人天那一项重新计算。
我们自己做项目的体感:用 AI Coding 辅助开发,代码生成、单元测试、接口适配、文档生成 这四类工作的人天压到了原来的 40%-60%。这意味着原本 150 人天的工程量,现在 70-100 人天就能完成。对小团队来说,这是个很关键的变化——原本只有大厂才能负担的生产级 Agent,现在 10-20 人的团队也能做出来。
但 AI Coding 压不下去的部分也要看清楚:需求澄清、数据治理、业务规则梳理、用户验收。这些工作的核心是「人对人」的沟通和判断,AI Coding 帮不上忙,反而因为后端工程变便宜了,前端的业务判断显得更值钱。
这条叙事我们在 定制软件成本拆解 里展开过,结论是:AI Coding 不是让定制更便宜,而是让「定制 + 标品」之间的边界重新模糊。小团队也能做出过去只有大乙方能交付的生产级 Agent,前提是业务想得清楚、数据准备到位。
九、给老板的 AI Agent 预算自检打分表
最后留一张可以直接打印贴在办公桌的自检表。每项 1-5 分,加总后对照判断:
| 自检项 | 1 分 | 3 分 | 5 分 |
|---|---|---|---|
| 场景具体度 | 想做 AI 但说不清场景 | 有 1-2 个明确场景 | 场景 + KPI + 用户都清楚 |
| 数据准备度 | 数据散在群文件 | 知识库已结构化 | 有专人维护 + 口径治理 |
| 用户准备度 | 老板想做、用户没空 | 部分用户愿意试 | 有内部冠军用户 |
| 预算心理价 | 5 万以内想搞定 | 30-100 万区间 | 100 万+ 且接受持续运维 |
| 失败容忍度 | 必须一次成功 | 接受 POC 失败 | 接受 30% 场景做不出 |
| 内部团队配合 | 业务部门不愿意配合 | 有项目经理推动 | 一把手挂帅 |
6-12 分:先别立项,回去把场景和数据想清楚,建议先看 为什么 AI 项目卡在 POC。 13-20 分:可以做 POC,预算控制在 3-10 万,验证清楚再扩。 21-30 分:可以正式立项,按本文第七节的盘子区间报预算。
这张表的目的不是劝退,而是让你在签字前确认:钱要花在哪儿、风险在哪儿、什么时候追加、什么时候止损。AI Agent 项目失败的真正原因,很少是「钱不够」,绝大多数是「钱花错了地方」。
写在最后
把 AI Agent 的费用拆开看,会发现它和传统软件项目最大的区别不是「贵」,而是「结构」。POC 验证、模型算力、工程定制、数据准备、持续运维——五块账,每一块都有自己的逻辑和陷阱。
老板和 CTO 要做的,不是去比三家方案商的总报价谁更便宜,而是问每家:你的报价里这五块怎么分?数据准备占多少?运维费怎么算?模型路线怎么选?敢把账拆开讲清楚的方案商,比那种「打包价 88 万」却不告诉你内部结构的,靠谱得多。
AI Agent 的钱怎么花,本质上不是技术问题,是经营判断。看清结构、控好节奏、留好余量,这笔账才能算得明白。




