去年年底有个做精密五金件的客户找过来,桌上摊着 3 份「AI 视觉质检」方案报价,最低 55 万、中间 90 万、最高 180 万。他先签了最便宜的那家,60 万拍板。签完 3 个月后来找我们诊断,落地实际花了 178 万——多出来的 118 万,全部花在报价单上没写的地方:机台改造多花 22 万、样本采集与标注多花 18 万、算法调优第二轮追加 30 万、PLC 与 MES 联调 15 万、上线后 3 个月的模型迭代 25 万,再加上一次相机换型 8 万。他捧着最终结算单问了一句:
「这些钱当初为什么没人告诉我?」
答案是:报价单没写不等于不发生,只是把成本推到你签完合同以后再算。 AI 视觉质检是一个「硬件 + 软件 + 数据 + 运维」四条线交织的项目,每一条线上都有一批容易被压掉的成本;把 4 条线都算干净,中小制造企业的视觉质检项目预算区间是 30-300 万,跨度巨大,取决于你要做的是「一个工位挑一种缺陷」还是「一条产线全流程放行」。这篇我们把完整成本拆到 5 段账,把 3 档预算基准钉在一张表里,再给 4 类典型产品缺陷场景的选型建议,以及上线前必须过的 5 条硬判断。下文所有金额区间来自开沿科技 5 年服务 2000+ 家企业、1000+ 个项目的沉淀,不针对任何具体厂商报价。
一、视觉质检为什么「看着容易做着贵」?3 个真相
大部分老板对 AI 视觉质检的直觉认知是——「一个相机加一个模型嘛,能有多贵」。这个直觉在 3 年前的 demo 视频里是对的,但落到真实产线上就完全变形了。视觉质检的成本远超硬件本身,主要贵在 3 个地方:工况复杂、样本要求高、集成难度大。 这 3 件事听起来是废话,落到报价单上就是 3 倍到 10 倍的价差来源。
真相一:工况复杂,一个工位的光学方案要试 5-10 版。 车间不是实验室。震动、粉尘、油雾、环境光变化、来料姿态不稳定,每一个都能让漂亮的 demo 模型失灵。做一个稳态的光学方案往往要试 5-10 种光源角度(同轴光、条形光、圆顶光、背光、多光源组合)× 3-5 种相机分辨率组合,加起来 20-50 组测试是常态。这个环节的时间成本、镜头光源试样成本,报价单里几乎不写,全部走「实施包干」,一旦发现原定方案不行,追加就来了。
真相二:样本要求高,「500 张缺陷图」是最低门槛。 AI 视觉模型不是配置一下就能用,是要真训练的。每一类缺陷至少 500-2000 张样本图起步,稀有缺陷(一条线一天出 5-10 个)凑齐这个量往往要 1-3 个月的产线采集期。中间还要人工标注——每张图人工画框、打标签,一张图 3-10 元的标注单价,累计几万到十几万很常见。样本这一环在报价单里最容易被藏在「甲方提供样本」这五个字里。等到实施了才发现,甲方没能力独立采集和标注,只能追加。
真相三:集成难度大,AI 不是孤立系统。 视觉质检要真正跑起来,得和现场 PLC 通信(触发拍照、接收判定信号、控制放行/剔除机构)、和 MES 对接(工单、批次、SN 号绑定)、和企业内网/数据平台打通(缺陷图归档、模型迭代数据回流)。这几条集成路径里,PLC 通信的协议还常常是老 S7-200/300、Modbus RTU 这种不太现代的东西,工程师要现场蹲 3-5 天才能调通一条链路。集成成本不写清,落地时按人天堆出来又是几十万。
对付这 3 个真相的办法,只有一个:把整个项目的 5 段账全部展开,逐条对齐口径,签合同时逐项写进附件。 下面我们把 5 段账一段一段讲。
二、3 档预算基准表:从单工位 20 万到全厂 200 万+
视觉质检项目按覆盖范围可以清晰分成 3 档:单工位、单产线、全厂多产线。3 档不是「便宜/中/贵」的关系,是不同规模、不同缺陷类型下的合理选择。
| 档位 | 价格区间 | 覆盖范围 | 典型场景 | 上线周期 | 精度典型指标 |
|---|---|---|---|---|---|
| 单工位 | 20-50 万 | 1 个工位、1-2 种缺陷 | 出厂前最终外观检、SN 校验 | 2-4 个月 | 检出率 ≥ 95%、误报率 ≤ 5% |
| 单产线 | 50-200 万 | 一条产线 3-6 个工位、5-15 种缺陷 | 汽车零部件在线检、电子外观 + 尺寸联检 | 5-9 个月 | 检出率 ≥ 98%、误报率 ≤ 3% |
| 全厂多产线 | 200 万+ | 多条产线、多品种、集中运维平台 | 3C 大厂多机型、汽车 Tier 1 全线 | 9-18 个月 | 检出率 ≥ 99%、误报率 ≤ 1%、模型平台化 |
这张表的 3 个读法很关键:
- 价格区间是「硬件 + 算法 + 集成 + 首批数据 + 试运行」的一次性投入。 不含机台改造额外结构件、不含每年运维、不含新增缺陷类型的重训——这几项都要单算,参考下文第三节的 5 段账。
- 精度指标是可谈判的,不同缺陷类型对「检出 / 误报」的容忍度不一样。 汽车安全件对漏检零容忍(检出率必须 100%,宁可误报率高一点靠人工复检兜底),消费电子外观检对误报率敏感(误报太多就等于全靠人挑,AI 没意义)。签合同前必须把每类缺陷的检出率/误报率目标写死。
- 档位不是线性升级的关系。 单工位跑得好不代表加钱就能扩到单产线,中间要重做工位排布、通信协议、模型平台化。想过一步跨到全厂多产线,往往要重写数据回流架构。所以「先单工位试点、以后再扩」的策略要在合同期就把「未来扩展路径」画清楚,不然到了扩产阶段又是一个全新项目重签。
一个真实判断顺序:先看缺陷类型稳不稳定(不稳定的直接不建议上),再看产线节拍要不要跟得上(高速产线单帧处理时间要压到 50ms 内),最后看预算和 ROI 是否能撑一条产线级的投入。 3 步答完,档位基本能锁死。
如果你想对照制造业整体的数字化预算区间,可以延伸看MES 上线预算 3 档拆解,那篇讲的是 MES 的预算分档,视觉质检往往作为 MES 里质量模块的一部分或独立系统,两者预算逻辑可以互相参考。
三、5 段完整账:视觉质检项目的成本骨架
我们复盘过一个 55 万签约、178 万落地的单产线视觉质检项目,5 段账各自的实际占比是:硬件 35%、算法 20%、集成 20%、数据 12%、运维(首年)13%。5 段里没有哪一段是「小头」,任何一段被压掉,最后都会变成隐藏成本长回来。下面逐段展开。
3.1 硬件账:相机 + 镜头 + 光源 + 结构件 + 算力
硬件是视觉质检的物理底座,占单工位预算的 30-45%。分几大类:
| 硬件类别 | 单价 | 常见配置 | 单工位小计 |
|---|---|---|---|
| 工业相机(面阵/线阵/3D) | 3千-8万/台 | 单工位 1-3 台 | 1-15 万 |
| 工业镜头 | 1千-3万/支 | 每台相机 1 支 | 0.3-6 万 |
| 光源(同轴/条形/圆顶/背光) | 500-2万/组 | 1-4 组组合 | 0.5-8 万 |
| 结构件(相机支架/光源支架/防护罩) | 定制 | 单工位 1 套 | 1-5 万 |
| 边缘算力盒 / 工控机 | 8千-5万 | 单工位 1 台 | 0.8-5 万 |
| 触发装置(光电/编码器) | 500-3千 | 1-2 个 | 0.05-0.3 万 |
| 剔除/分选机构 | 3千-3万 | 视场景 | 0-3 万 |
3 个容易踩坑的点:
- 相机档位一定要匹配缺陷特征尺寸,不要图便宜。 100 微米的缺陷要用 1200 万像素以上的相机,非要用 500 万像素的相机就是等着漏检。相机的选型逻辑是「像素 = 视场 ÷ 精度 × 3」,这是硬约束不是可谈判项。
- 光源比相机还重要。 我们做过的项目里,60% 以上的「模型效果差」最终查出来的根因是光源方案错了,不是模型烂。同一颗划痕,同轴光下拍不出、45 度条形光下清晰得像刻上去的——花几千块换光源比花几十万重训模型有效得多。
- 结构件不要省。 相机悬挂、光源固定、防护罩这些机加件看着不起眼,但决定了系统的稳定性。用铝型材临时搭一个「先用着」,1-2 个月后必然要拆了重做,结构件返工的钱和停线时间损失远远大于一次性做好的费用。
判断硬件报价合理的一个简单方法:让报价方把每一颗相机的品牌型号、每一支镜头的焦距和工作距离、每一组光源的功率和角度都列进合同附件。 拒绝提供的服务商,硬件档位的水分可能有 30% 以上。
3.2 算法账:模型开发 + 训练 + 优化
算法这一段是价差最大的一段。同样叫「AI 视觉模型」,从「套用一个开源预训练模型改改参数」到「针对客户产线从零训练 + 数据增广 + 后处理规则」,价差 5-10 倍。
| 算法工作项 | 常见工时 | 单价 | 小计 |
|---|---|---|---|
| 光学方案打样与初验(含到现场试样) | 5-15 人天 | 2000-3500/人天 | 1-5 万 |
| 数据准备(清洗/增广/切分) | 5-15 人天 | 1500-3000/人天 | 0.8-4.5 万 |
| 模型开发与训练(含超参调优) | 10-40 人天 | 2000-4000/人天 | 2-16 万 |
| 后处理规则 / 判定策略 | 3-10 人天 | 2000-3500/人天 | 0.6-3.5 万 |
| 现场调优(第一次上线闭环) | 5-15 人天 | 2500-4000/人天 | 1.25-6 万 |
算法这一段最常见的 3 类「口径不清」:
- 「一个模型」到底覆盖几类缺陷? 一个模型跑 3 类缺陷和跑 15 类缺陷,训练成本完全不是一个量级。签合同前要把「本次交付模型覆盖的缺陷种类清单」写死,不写就是无底洞。
- 「95% 检出率」是拿哪批样本测的? 用训练集自己测和用真实产线新样本测,能差 10-20 个百分点。合同里必须写「检出率以验收阶段现场采集的 X 张新样本盲测为准」。
- 「上线后一年内的模型迭代」含不含? 大部分报价「不含」,但客户以为「含」。等到 3 个月后要新增一类缺陷,对方拉出一份 15 万的重训报价,客户就崩溃。这一条必须写清「首年 X 次重训包含在合同内、超出按 XX 元/次追加」。
关于 AI 项目开发工时和口径的更多拆解,可以延伸看AI Agent 定制开发成本拆解,里面有一份和视觉质检类似的「工时清单 + 单价基准表」。
3.3 集成账:PLC 通信 + MES 对接 + 机台改造
集成账是最容易被压掉、也最容易爆的一段。视觉质检不是孤立的相机+算力盒,要和现场设备、MES、上位机、数据平台全部打通。
| 集成工作项 | 常见工时 | 单价 | 小计 |
|---|---|---|---|
| PLC 通信(Modbus/S7/OPC UA) | 5-15 人天 | 2500-4000/人天 | 1.25-6 万 |
| MES 对接(工单/批次/SN 绑定) | 8-20 人天 | 2000-3500/人天 | 1.6-7 万 |
| 机台机械改造(相机位、光源位、剔除机构) | 项目制 | 定制 | 5-30 万 |
| 网络与数据链路(现场交换机/VLAN/存储) | 3-10 人天 | 1500-3000/人天 | 0.5-3 万 |
| 现场停线联调 | 3-7 天停线 | 停线损失自算 | 视产线而定 |
集成账的 3 个真相:
- 机台改造的钱几乎都是漏算的。 大部分报价里写着「利用机台现有安装空间」,实际到现场发现要拆罩子、加桥架、改传送带节拍,随便就是十几万的机加与停线成本。这一项的规避方法是签合同前让服务商到现场做 1-2 天的实地勘察,出一份《机台改造清单》作为合同附件。
- PLC 通信协议千奇百怪,老设备协议翻倍报价。 20 年前进口的机台,可能是 Profibus 或者某个国外厂商私有协议,需要工程师现场逆向或者加通信网关。老设备接线时间是新设备的 2-3 倍。
- 停线联调的机会成本要提前预留。 一条月产值 500 万的产线,停 3 天就是 40-50 万的机会成本。合同里必须约定「联调窗口时间 X 天」,超期部分的产能损失责任怎么分。
3.4 数据账:样本采集 + 标注 + 维护
数据是视觉质检的燃料,也是很多老板最没有心理准备的一段。「我以为拍照就行了,怎么还要标注?标注怎么那么贵?」——这是我们复盘时最常听到的疑问。
| 数据工作项 | 单价 | 常见工作量 | 小计 |
|---|---|---|---|
| 样本采集(产线蹲守/暗场景造样本) | 5000-2万/工位/周 | 2-8 周 | 1-16 万 |
| 数据标注(矩形框/像素级/分类) | 3-10 元/张 | 每类 500-2000 张、5-15 类 | 1-30 万 |
| 数据质检(标注复核) | 1-3 元/张 | 全量抽查 30% | 0.3-9 万 |
| 数据平台(存储/版本管理/回流) | 定制 | 单次投入 | 3-15 万 |
| 持续数据回流(每月新样本) | 2000-8000 元/月 | - | 年化 2-10 万 |
这一段账最容易被藏在合同里的「甲方提供样本」5 个字里面。 甲方以为「我们车间每天生产几万件,样本还不好找」——但真到落地才知道,稀有缺陷可能一天只有 5 个,还散落在不同班次,凑齐一类 500 张要 2-4 周纯采集,稀有的甚至要 2-3 个月。中大型工厂内部很少有具备标注能力的人手,最后要么外包(每张 3-10 元)、要么由服务商代做(每张 8-15 元,含平台管理费)。
我们的建议是:数据这一段宁可花在服务商身上,也不要图省事推给自己内部。 内部临时组个标注小组,往往是「三天热度、标注质量参差不齐、AI 训完效果差」的死循环。
3.5 运维账:模型漂移 + 上线更新 + 异常复盘
运维是视觉质检和普通 MES/ERP 项目最不一样的一段。普通系统上线后运维主要是「有 bug 修 bug」,视觉质检的运维是「模型持续跑坏、持续要重训」。 首年运维预算的合理占比是合同金额的 15-25%,往后每年 10-20%。
| 运维工作项 | 单价 | 频次 | 小计(首年) |
|---|---|---|---|
| 模型漂移监控与告警 | - | 持续 | 平台工具费 1-3 万 |
| 定期重训(每季度 / 换型时) | 1.5-5 万/次 | 首年 4-8 次 | 6-30 万 |
| 现场硬件运维(相机脏了、光源老化) | 5000-2万/次 | 首年 4-10 次 | 2-15 万 |
| 异常复盘(漏检客诉倒查) | 3000-1.5万/次 | 首年 2-8 次 | 0.6-8 万 |
| 新增缺陷类型上模型(追加) | 3-15 万/类 | 视换型频率 | - |
运维这一段的 3 条铁律:
- 模型不重训就一定漂移。 3-6 个月内漏检率涨 10-30% 是常态,不重训就是等着客诉爆发。
- 相机、光源是消耗品。 光源大部分寿命 1-2 年,相机镜头油污渗入 6-12 个月要清理,都是硬性投入。
- 首年运维一定要签合同锁死。 没有运维合同的视觉质检项目,我们见过的 90% 都在上线后 6-12 个月内变成「员工绕过 AI,全靠人工目检兜底」,前期投入几乎全部打水漂。
关于运维费怎么谈、必写条款有哪些,我们在软件维护费一年多少钱里做过完整拆解,视觉质检的维护合同可以在那份模板基础上加「模型重训次数」「数据回流责任」两条特别条款。
四、4 类产品缺陷场景推荐档位表
不同类型的产品缺陷,做视觉质检的难度、预算、精度目标差别很大。下面这张表汇总了 4 类最常见的中小制造场景:
| 缺陷类型 | 典型行业 | 技术难点 | 推荐档位 | 预算区间 | 精度参考 |
|---|---|---|---|---|---|
| 外观漏检 | 消费电子、五金、包装 | 缺陷类型多、样本少、光源方案敏感 | 单工位-单产线 | 30-120 万 | 检出率 ≥ 97%、误报率 ≤ 3% |
| 尺寸测量 | 精密加工、汽车零部件 | 精度要求高、需高分辨率相机+标定 | 单工位-单产线 | 40-150 万 | 精度 ±0.02-0.05mm |
| 表面质量(划痕/污渍/凹陷) | 玻璃、金属、面板、涂装 | 反光/透明表面难成像 | 单产线 | 60-200 万 | 检出率 ≥ 95%、误报率 ≤ 5% |
| 装配错检(漏装/错装/反装) | 汽车、家电、机电装配 | 多目标、位姿变化大 | 单产线-全厂 | 80-250 万 | 检出率 ≥ 98%、误报率 ≤ 2% |
3 条选场景规律:
- 外观漏检和装配错检对「样本齐全」依赖最重。 缺陷类型越多,凑齐样本的时间越长,数据段成本越高。样本条件不好的情况下强上,模型三个月内失灵是必然结果。
- 尺寸测量的核心不是 AI,是标定和高精度相机。 这类项目算法段成本相对低(大部分是几何计算 + 规则判定),但硬件段和结构件段成本极高,因为要用 500 万像素以上的高精度相机 + 精密安装位。
- 表面质量的最大难点是光学,不是算法。 反光金属、透明玻璃、拉丝面板这些材料,光源选型往往要试 5-10 版,光学工程师的现场时间是主要成本,不试透就交付的项目基本上线后都要返工。
延伸阅读:如果你在做制造业整体的 AI 场景规划,可以配合制造业 AI + MES 场景一起看,那篇从场景角度做过一次梳理,本篇是从成本角度做拆解。
五、上视觉质检前的 5 条硬判断
不是所有工厂当下都适合上 AI 视觉质检。我们诊断过的项目里,大概有 25% 建议客户「暂缓上视觉质检、先修好现场标准化」就够了。判断一家工厂现在是否到了上线时机,看下面 5 条硬判断,全部命中才推进,命中不到 4 条先修 XX。
| 硬判断 | 警戒线 | 说明 |
|---|---|---|
| 缺陷类型稳定 | 3 个月内新增缺陷类型 ≤ 2 类 | 不稳定的产品线上 AI 就是等着一直重训、一直加钱 |
| 样本可采集 | 每类缺陷 30 天内能凑齐 500 张以上 | 稀有到 90 天凑不齐的缺陷,考虑异常检测或人机协同兜底 |
| 工况可控 | 光照/来料姿态/环境震动可稳定 | 露天/搬运频繁/环境剧烈变化的场景,硬件预算翻倍 |
| 合规接受 | 客户/监管接受 AI 判定作为放行依据 | 汽车安全件、医疗器械要求人工复检兜底,AI 只做辅助 |
| 团队跟得上 | 现场有 1 名工程师能日常处理告警和数据 | 没人维护的 AI 系统,3-6 个月就废 |
特别提醒 2 条最容易被忽视的信号:
- 管理层是否有耐心陪跑 3-6 个月? AI 视觉质检不是「买回来插上就能用」,头 3 个月的漏检率、误报率、告警响应流程都要磨合。如果老板期望是「一个月内看到全线放行」,先把预期降下来再动手。
- 质量部门是否接受「AI 报警要人工复核 + 数据反馈」? 大部分工厂质检员的心态是「有 AI 就不用我了」,实际上前 6 个月最需要质检员参与数据反馈。这个心态不调整、绩效不重设,AI 就跟质检团队对立,落地永远做不成。
反过来,5 条命中不到 4 条的工厂强上视觉质检,我们见过的结局无外乎 3 种:模型三个月内失效重训到爆预算、员工绕过 AI 全部人工兜底、系统被搁置成为参观样板。 这几种结局在事后复盘时几乎都能追溯到——签合同前 5 条硬判断没过关。
六、AI 加进来的 3 个进阶场景:小样本 / 异常自适应 / 多机型迁移
基础视觉质检跑通之后,2026 年真正在中大型客户落地的 3 类进阶场景,值得预算级客户提前评估。我们在过去 5 年、1000+ 个项目里,帮制造业客户做过其中的一些落地:
场景一:小样本 / 少样本学习(Few-shot Learning)。 以前怎么做:一类新缺陷凑不齐 500 张样本,模型就训不出来,只能等产线自然出更多缺陷或者人工造缺陷。 现在怎么做:用预训练大模型 + 少量样本微调,10-50 张样本就能达到可用精度(85-95% 检出率),先上人机协同兜底,同时继续积累样本,2-3 个月后切自动放行。 落地成本:15-40 万增量,前提是已经有一套基础视觉质检平台。适用场景:多品种小批量、频繁换型、稀有缺陷场景。
场景二:异常自适应(Anomaly Detection)。 以前怎么做:每加一类新缺陷都要重新标注、重新训练,成本线性增长。 现在怎么做:模型只学「正常产品长什么样」,不像正常的就报警,把「有限枚举缺陷类型」变成「无限种未见异常」都能检出。代价是误报率通常高一档(3-8% 常见),要人工复核兜底。 落地成本:25-60 万,适合缺陷类型无穷无尽的场景(比如注塑件的杂质、玻璃的气泡)。
场景三:多机型 / 多产品迁移学习。 以前怎么做:换一款产品重训一个模型,10 款产品要 10 个模型,运维负担大。 现在怎么做:一个基座模型 + 每个产品的小微调头,1 天内切换一个新产品,运维成本降 50-70%。 落地成本:40-100 万,适合有 5 款以上产品、频繁换线的工厂(3C、汽车 Tier 2 常见)。
3 个场景的落地成本区间是叠加在基础视觉质检项目上的增量,不是重头做。判断这 3 个场景要不要上的核心逻辑是——基础质检项目跑稳没有? 基础没跑稳就做进阶,纯属浪费预算。基础跑稳后再做进阶,一年内 ROI 就能看得见。
七、写在最后:AI 视觉质检成本的 3 条铁律
AI 视觉质检项目预算的合理边界,5 段账拆完,收敛成 3 条铁律:
第一,报价单要拿到「硬件 BOM + 算法工时 + 集成人天 + 样本数量 + 首年运维」5 张明细表,缺一张都不签。 5 张表凑不齐的服务商,报价再便宜都不能签,隐藏成本一定爆。视觉质检项目的合同金额 × 1.8-2.5 才是真实落地总投入,乘数低于 1.5 的报价单,大概率是把二期成本推给你自己扛。
第二,5 条硬判断至少命中 4 条再上。 缺陷类型不稳、样本采不齐、工况不可控、合规通不过、团队跟不上——任何一条不满足就先修那一条,别为了上 AI 而上 AI。视觉质检不是一次投入的资产,是一个需要持续喂数据、持续重训、持续陪跑的系统,前期不做好准备,后期烧钱如流水。
第三,价值不在系统本身、在系统稳定跑起来之后沉淀的缺陷数据资产。 一套跑了 2 年的视觉质检系统,沉淀下来的缺陷图库、标注数据、模型迭代记录,本身就是工厂质量能力最有价值的资产,能反哺工艺改进、供应商管理、来料检验——这才是视觉质检真正的长期价值,不是一次性替代几个质检员的短期账。
如果你正拿着几份 AI 视觉质检的方案报价不知道怎么选,或者已经上了一期发现二期成本超预算失控,欢迎把手里的报价单、现场工况照片、缺陷样本情况、现有系统架构整理一下,我们可以一起看看里面有哪些口径要修、哪几档更适合、5 段账里哪几段被压平了。中小制造上 AI 视觉质检是一个动辄百万级的大决定,值得花几周把这件事想透,比签完合同再后悔要划算得多。








