AI Agent 项目的真实周期,分 3 周 POC、3 月业务级、6 月+ 战略级三档,不存在「一个月就能用」或「不到半年别想」的笼统答案。 很多老板现在被两种声音搞得很拧巴:一类厂商说「我们用大模型,一周就能出 demo」,一类厂商说「企业级 Agent 没有 6-12 个月别想跑顺」。两种说法都对,但都没说全——它们说的是不同档位的项目。
真正的问题不是「Agent 开发要多久」,而是「你这个场景应该用哪一档来做」。选错档位的代价很直接:用 POC 的预算去做战略级项目,3 个月后只能交一个 demo;用战略级的排期做 POC,老板等不到第 4 个月就把项目砍了。
这篇不堆方法论,给你一张能照甘特图执行的判定表:三档项目分别长什么样、决定周期的 4 个变量怎么算、6 周看见价值的最小可行节奏怎么排。看完你应该能回答两件事——自己这个 Agent 项目该排几周、每个阶段交付什么。
一、三档项目周期到底差在哪?
3 周 POC、3 月业务级、6 月+ 战略级这三档的差别,不是「做得多大」,而是「Agent 跟业务系统的耦合深度」。 耦合越深,要协调的部门越多、要审的合规越多、要做的回滚机制越多,时间就越长。
把三档放一起看:
| 档位 | 周期 | 典型场景 | Agent 干预业务 | 涉及系统 |
|---|---|---|---|---|
| POC 档 | 2-4 周 | 销售日报自动汇总、客户跟进摘要、内部知识问答 | 只读、只生成内容、不写回 | 1 个数据源 |
| 业务级 | 10-14 周 | 商机自动跟进、订单状态预警、对账差异检测 | 可写回 CRM/ERP、可触发钉钉提醒 | 2-3 个系统 |
| 战略级 | 6-12 月 | 自动定价、智能审批、跨部门工单调度 | 直接做出业务决策、影响财务数据 | 4+ 系统,含合规审批 |
POC 档的核心目的是「验证这个场景值不值得继续投」。3 周里你应该看到一个能跑的 demo,能用真实数据复现 5-10 个典型案例,准确率有个底数。预算 3-8 万,团队 1-2 人,业务侧配合时间每周 4-6 小时。
业务级是 90% 中小企业真正需要的档位。3 个月里你要交付的不只是一个 Agent,而是「这个 Agent 在你公司天天有人用、有人反馈、有人维护」的完整闭环。预算 15-40 万,团队 2-3 人 × 3 个月,业务侧需要一个全职 30% 投入的对接人。
战略级通常是头部企业、上市公司、或国央企的项目。6 个月以上的周期里,技术开发可能只占 40%,剩下 60% 是流程梳理、合规审批、灰度发布、效果验证。预算 80 万起步,团队 4-6 人长期投入。中小企业一上来就要做战略级,多半是被销售故事忽悠了。
一个简单的判断:如果你这个 Agent 出错最坏的后果是「老板看到一份错的日报」,做 POC 档;如果最坏后果是「销售跟错客户、订单状态发错」,做业务级;如果最坏后果是「公司亏一笔钱、需要法务介入」,做战略级。
二、决定周期长短的 4 个变量分别要排多少时间?
同一档位的项目,4 个变量决定了你是排在档位下沿还是上沿——数据准备、集成复杂度、业务参与度、合规审批。 任何一档项目,先回答这四个问题,再下排期。
变量 1:数据准备状态——Agent 要用的数据如果已经在 CRM、钉钉、ERP 里、口径统一、字段命名规范,准备时间 1 周;如果数据散在 Excel + 几个系统、口径不一、还缺字段,准备时间 3-5 周。中小企业里数据现成的情况其实不到 30%。
变量 2:集成复杂度——只读 1 个系统 = 1 周;读写 1 个系统 = 2 周;读写 2-3 个系统并要保证一致性 = 4-6 周;涉及自研老系统没有标准 API = 再加 3-4 周做接口改造。
变量 3:业务参与度——业务侧每周能给 1-2 小时 = 项目周期 ×1.5;能给 6-8 小时(固定时间) = 周期按基准走;能给 1 个全职人 = 周期 ×0.8。注意「按需配合」不算配合,等于没有。
变量 4:合规与审批——涉及个人隐私数据(销售、HR 类)= 加 2 周做权限和脱敏;涉及财务、医疗、金融数据 = 加 4-6 周做合规审计;需要私有化部署 = 加 4 周做环境搭建。中小企业一般卡在前两项。
我们在交付过的项目里见过最典型的踩坑:业务级项目排 3 个月,结果集成复杂度被低估、业务侧又只能「按需配合」,最后拖到 6 个月才上线。判断方法是把这四个变量摆在桌面上算清楚,加起来才是真实周期。背后的总体方法论可以读 企业 AI Agent 怎么落地:从哪个场景开始的路线图。
三、用甘特图想象一个典型业务级项目的 14 周排期
业务级 Agent 的 14 周排期,可以拆成 4 个阶段,每个阶段都有明确的交付物和 stop 信号。 这套排期是开沿在中小企业项目里反复跑出来的节奏。
第 1-3 周:场景对齐 + 数据梳理
- 业务侧产出:5-10 个真实业务案例 + 验收标准(量化)
- 技术侧产出:数据 schema、字段口径文档、权限设计
- 阶段 stop 信号:如果第 3 周还没法把验收标准写成「准确率 ≥ X%、连续 Y 周 ≥ Z 个人使用」这种格式,停下来重新对齐,别往下推。
第 4-7 周:原型开发 + 真实数据 POC
- 技术侧产出:Agent 原型、prompt 体系、5-10 个真实案例跑通
- 业务侧产出:每周固定 2 小时评测会、给反馈
- 阶段 stop 信号:第 6 周如果准确率还不到目标的 70%,要么调整场景、要么暂停项目。这一步如果硬撑,后面只会更难收。
第 8-11 周:系统集成 + 灰度上线
- 技术侧产出:CRM/ERP/钉钉的读写接口、错误回滚机制、人工兜底入口
- 业务侧产出:选 1-2 个先用的人、记录使用日志和异常
- 阶段 stop 信号:如果集成后准确率掉了超过 15 个点(系统数据和测试数据不一致),立刻退回原型阶段排查数据问题。
第 12-14 周:扩量 + 效果固化
- 技术侧产出:监控面板、SOP 文档、二线团队培训
- 业务侧产出:使用人数扩到 5-10 人、连续 4 周稳定使用
- 验收标准:日均使用次数、准确率、业务方满意度三项达标。
这个排期里有一个隐含的「6 周看见价值」节奏——第 6 周末,老板应该能看到一个能用真实数据 demo 的版本,不是 PPT、不是 mock。第 6 周看不到这个东西,后面 8 周大概率也救不回来。
想看 30 天试点期更细的节奏怎么排、怎么写验收条款、怎么避免「演示完就再没人用」,可以读我们专门写的 AI Agent 试点 30 天怎么排。
四、中小企业最常踩的 3 个排期坑
中小企业做 AI Agent 最容易踩的坑,不是技术选错,而是档位错配、节奏错配、人错配。
坑 1:用 POC 预算做业务级范围——最常见。预算批了 5 万、3 周交付,但范围里写着「打通 CRM 和 ERP、自动跟进客户、自动出报价」。这个范围真做出来要 30-50 万、3-4 个月,5 万只够走完场景对齐和数据梳理。判断方法:预算 ÷ 5 万 ≈ 周期月数(粗略经验值),算完不对就先砍范围。
坑 2:业务侧「需要时再叫」——这是延期的头号原因。业务侧领导嘴上说「全力支持」,实际把对接人安排成「有空就来」。这种配合方式下,业务级项目实际会拖到 5-6 个月,并且大概率交付后没人用。解法是立项时把「每周固定 X 小时对接时间」「对接人姓名 + 直接上级背书」写进合同附件。
坑 3:跳过灰度直接全员上线——demo 跑通后老板要求第二周就全公司用上。结果第一波 50 个人用下来发现 30% 的 case 出错,业务侧信任崩塌,Agent 被打入冷宫。正确节奏是 1 → 3 → 10 → 30 人,每一档稳定 2 周才扩下一档,整个扩量周期 6-8 周。
行业里其他厂商常用的报价方式是给一个「总价 + 总周期」的打包数字,但拆不清各阶段交付物。开沿的做法是按 4 个阶段分段验收、分段付款,跑不出来可以提前停项目,不让客户被长合同绑死。这种排期我们近年累计接触的几十家客户里都验证过。
下一步
把这篇里的三档判定表、4 个变量、14 周甘特图拿出来对一下你手上那个 Agent 项目——如果你也吃不准是该排 3 周 POC 还是 3 个月业务级,或者厂商给你的报价和周期对不上,和我们聊聊,工作时间优先响应。我们可以拉一个 30 分钟的电话会,按你的场景、数据现状、业务参与度,给一份能直接走的排期判断。开沿科技专注「钉钉服务、企业管理软件定制开发、AI Agent 落地」三件事,AI Agent 项目我们一年跑十几个,节奏怎么排心里有数。








