某 80 人规模的鞋服批发企业,老板年初看了几条 AI Coding 视频后做了个决定:让公司里会写点 Python 的运营总监带两个实习生,用 Cursor 把订单系统重写一遍。三个月后系统跑起来了,但每次开单要 5 分钟,库存偶尔错位,仓库怨声载道。看了代码:思路没大问题,缺的是并发、事务、异常那些"老程序员才会条件反射写下"的边界处理。AI Coding 给了他一个能演示的 demo,但没给他一个能扛业务的系统。
这类故事 2025 年开始密集出现。Claude Code、Cursor、通义灵码、Copilot 让"不会编程也能写代码"从口号变成现实,老板和 CTO 都在问:我们能不能自己写业务系统?写到什么程度才算靠谱?这篇不站队也不卖工具,只把踩过的坑、跑通的场景摆出来。
一、AI Coding 工具现在到底能做什么
把 2026 年初市面上常见的几款工具按"能不能独立交付一个能用的小系统"来分层,差别比想象的要大。
| 工具 | 能力定位 | 适合谁用 | 典型局限 |
|---|---|---|---|
| Claude Code | Agent 式编码,能跨多文件改、自己跑命令、自己 debug | 有一定工程基础、想加速交付的人 | 长上下文容易跑偏,需要人定期"对齐" |
| Cursor | IDE 内 AI 补全 + Chat + Agent | 已经会写代码的人,想提速 30%-50% | 完全没基础的人容易把"接受 AI 建议"当成"理解了代码" |
| 通义灵码 / GitHub Copilot | 主打补全,少量轻量重构 | 全员铺开的代码助手 | 跨文件改造能力弱,做不了"端到端完成任务" |
| 各类 No-Code/Low-Code AI 助手 | 在已有平台内拉表单+生成简单逻辑 | 完全不写代码的业务人员 | 跑不出平台本身的能力边界 |
工具是放大器,不是替代器。Claude Code 把会写代码的人放大到 3-5 倍效率,把完全不会写代码的人放大到能做出"看上去能跑"的 demo——中间是两个不同的世界。公司"懂技术的人"是产品经理、是会用 Excel VBA 的财务,配上 Claude Code 后能做的事比一年前多了很多,但没多到能取代一个正经工程团队。
二、中小企业自研业务系统的三类场景
把"自己写业务系统"按目标拆开看,至少有三类,难度和风险天差地别。
内部小工具。 把分散在十几个 Excel 里的客户跟进表合成一个看板、把人工统计的周报做成自动汇总、把员工每天填的几张表换成一个表单页。这类工具用户少、改得快、错了好回滚,是 AI Coding 时代最适合"业务方自己上手"的场景。
业务流程辅助。 已经有 ERP/CRM 在跑,但中间有几个环节走不通——发货前要从三个系统抓数据手动拼成发货单、售后要从五个表里捞历史订单。这类不是"取代主系统",而是"在主系统外面补一层胶水"。AI Coding 能干,但要协调三方接口、处理跨系统数据一致性,难度大一档。
完整业务系统。 想自己写一套订单管理系统、写一套小型 ERP、写一套面向客户的小程序+管理后台。这是公开内容里被吹得最多、也最容易翻车的场景。能不能写出来?能。能不能稳定支撑主营业务跑几年?大概率不能。原因不在 AI,而在企业有没有持续投入工程能力维护它的准备。
判断诉求落在哪一类,比直接问"能不能用 Claude Code"重要得多。这部分我们在标品 80% 之后剩下 20% 怎么补里也展开过——AI Coding 大幅降低了补 20% 缺口的成本,但没改变"主系统不是闹着玩的"这件事。
三、能跑通的 4 类场景
把过去半年里见到的、跑通了的中小企业自研案例归一下类,大致是这几个方向能稳定收到效果:
- 数据看板与经营分析。 老板想看"昨天每店成交、每销售跟进、每渠道获客成本",这种多源数据拼到一起做可视化的活,AI Coding 配上一个会写 SQL 的人,一两周能搞出第一版。
- Excel 替代。 那些用了多年、几十张 sheet 互相引用、传到第三个人手里就崩的"业务老 Excel",用 AI Coding 重写成一个有库的简单 Web 应用,门槛比想象中低。
- 简单审批与表单流。 不涉及复杂多级会签、不涉及外部对接的内部小流程——出差申请、备品借用、临时采购——AI Coding 几小时能写一个端到端版本。
- 内部知识库与问答。 把产品手册、客户 FAQ、内部 SOP 喂给一个简易 RAG 系统,给客服、销售、新员工用。AI 本来就擅长处理文本。
共性是:用户量不大、错了不致命、不需要 7x24 高可用、业务规则相对清晰。换句话说,是那些"以前公司觉得花钱定制不划算、买标品又用不舒服"的中间地带。AI Coding 真正改变的是这一段的经济性。
四、撑不起的 4 类场景
也有四类活,无论 Claude Code/Cursor 怎么进化,2026 年这个时间点都不建议中小企业自己扛:
复杂业务模型。 真正的 ERP 核心、MES 排程、零售连锁的库存与价格中台,业务规则不是"写出来"的,而是从无数次踩坑里"长出来"的。AI 能帮你把想清楚的逻辑落成代码,帮不了你把没想清楚的业务想清楚。可参考制造业 ERP 与 MES 没人用怎么办。
多人协作与权限体系。 看似简单的"按部门看数据""按角色发起流程",背后是一整套权限模型。AI 写第一版很快,写到第三版用户开始反馈"为什么我看不到""为什么他能改"的时候,几乎一定会推倒重来。
严肃合规与对外业务。 涉及发票、电子合同、支付、医药/食品追溯的系统,错一次代价极高。AI Coding 可做内部辅助工具,但作为对外正式系统跑,仍需团队过合规、安全、压力测试。
长期维护。 一个系统跑通和稳定跑三年是两件事。后者需要有人持续盯日志、改 bug、应对 OS/库升级、补回归测试。AI Coding 让"写出第一版"便宜,但"养活三年"的人力成本几乎没变。
五、替代路径:自研轻量 + 外部接重活
那把"自研"和"外包"对立起来吗?不必。真正可行的路径是把它们组合起来,按场景分工。
| 场景类型 | 推荐方式 | 团队配置 | 理由 |
|---|---|---|---|
| 内部小工具 / Excel 替代 | 业务方+AI Coding 自研 | 业务骨干 1-2 人 | 改的人就是用的人,迭代最快 |
| 业务流程辅助 / 看板 | 自研为主,关键接口找外援 | 内部 1 人 + 外部按工时 | AI 处理不了的多系统对接交给专业人士 |
| 主营业务系统 / 对外产品 | 外部团队主导,AI 加速 | 外部团队 + 内部接口人 | 工程化、可维护性、合规由专业团队兜底 |
| AI Agent 接业务 | 联合开发 | 业务方提流程,外部搭框架 | Agent 调试需要业务+技术持续磨合 |
"轻活自己干、重活找外援",让 AI Coding 在企业里发挥真正的杠杆。我们在定制软件外包贵在哪和定制软件公司怎么挑里强调过:AI Coding 时代选服务商不再看"人头便不便宜",而看"AI 加成下他们能不能把单位人力交付的复杂度撑得更高"。
六、为什么 5 人小团队是 AI Coding 时代真正受益者
AI Coding 真正帮到的并不是"完全没研发的中小企业自己上手",而是"原本只有 3-5 人小研发团队"的那批公司——包括很多服务中小企业的小型软件商。这些团队同时具备一点工程基础、一身业务理解。AI Coding 把他们的产出放大到接近过去 10-15 人团队的水平。开沿自己作为 AI 原生小团队做交付的体感很明显——同样客户预算下,能落地的业务深度比 2024 年提升了一档。
企业选合作伙伴有了新的判断方向:**对方有没有真在用 AI Coding 做交付?交付物里有没有清晰的结构与文档?**这两个问题比看公司规模有用。
七、自研 vs 外包 vs 标品 的 3 年总账
光算"开发费"会误导决策,把 3 年总账算出来看更清楚。下面是 50-100 人企业搭一套核心业务系统的常见量级,不针对任何具体客户。
| 路径 | 首期投入区间 | 每年维护占比 | 3 年总成本结构 | 主要风险 |
|---|---|---|---|---|
| 完全自研(AI Coding) | 显性投入低 | 内部人力 30%-50% | 人力为主,外购为辅 | 人走了,系统也走了 |
| 外包定制 | 一次性较高 | 10%-20% | 首期+年度维护合同 | 沟通成本与变更成本 |
| 标品 SaaS | 订阅起步低 | 续费曲线非线性 | 续费+二开+集成 | 业务越长越深越不顺手 |
| 标品 + 轻定制 | 中等 | 15%-25% | 标品续费+定制维护 | 边界划不清 |
| 自研轻+外包重 混合 | 中等 | 15%-25% | 内部小工具人力+外部主系统年费 | 双方角色不清会互相推诿 |
"首期投入"放区间不放绝对值,因为不同行业、不同业务复杂度差别太大。但有一个判断稳定成立:3 年看下来,纯自研未必最便宜,纯外包未必最贵,混合路径在大多数中小企业身上都更合适。这和我们在ERP 实施费用拆解与SaaS 订阅与定制买断怎么算聊过的逻辑一致。
八、决策卡:你的活该自研还是外包
最后给一张可以直接拿去用的判断表。按下面 8 题给自己打分:每个"是"得 1 分,"否"得 0 分。
| 题目 | 是 | 否 |
|---|---|---|
| 用户少于 30 人 | □ | □ |
| 业务规则我能用一段话讲完 | □ | □ |
| 错一次也不会影响生意 | □ | □ |
| 公司有一个愿意持续维护它的人 | □ | □ |
| 不需要对外开放 / 不涉及支付与合规 | □ | □ |
| 不需要和现有 ERP/CRM 深度互通 | □ | □ |
| 可以接受半年内重写一次 | □ | □ |
| 老板支持业务方花时间钻研工具 | □ | □ |
- 6-8 分:放心自研,AI Coding 就是为这种活准备的。
- 3-5 分:自研做原型,找外部团队把工程化部分接走。
- 0-2 分:别折腾,走外包或标品+轻定制;可参考CRM 自建还是买与定制开发 vs SaaS 怎么选的决策框架。
价值不在分数本身,而在让团队对齐"我们到底要做的是什么样的活"。很多翻车项目都败在老板觉得是 6 分活、技术觉得是 2 分活,互相不说破,干到一半才发现期望对不上。
九、结语
Claude Code 和 Cursor 不是来取代企业 IT 投入的,它们是让原本"够不着定制开发"的中小企业,第一次有机会拥有真正贴合业务的小工具。但工具再聪明,也替不了对业务的理解、替不了长期维护的耐心、替不了对边界的清醒判断。把能自研的轻活干掉,把不该自研的重活交给专业团队加 AI 一起干,是 2026 年中小企业用 AI Coding 较稳妥的姿势。同样思路也可看AI Agent 落地路线图与企业 AI 项目为什么卡在 POC。




