开沿科技
13305079753先填 5 道题
钉钉深度玩法

钉钉悟空 API/二开能干什么?把 Agent 接到自家 ERP/CRM 的真实路线

开沿研发中心·2026-06-14·16 分钟阅读

某 80 人规模的鞋服批发企业上个月把钉钉悟空开了一个月,业务一线很兴奋——销售在群里 @ 悟空问「这个客户上个季度发了多少货」,悟空答得头头是道。但开了一周老板就发现,悟空只能基于上传的知识库回答,要查实时库存、查回款、查在途订单,它一概不知。IT 负责人来问:能不能让悟空连进我们自己的 ERP 和 CRM?要走悟空 API 二开吗?投入大概多少?这条路走通了能解决什么?

这是绝大多数开通悟空之后会立刻撞上的问题。原生悟空靠 RAG 啃知识库可以解决「员工手册」「产品参数」「政策法规」这类静态问答,但凡涉及实时业务数据,就必须走 API/二开把 Agent 接到自家业务系统里。这篇把开放度、3 条接入路线、数据和权限的处理方式、调试上线三件套以及一个能直接用的决策清单全部讲清楚,让你看完能判断:自家这套组合,到底是该走原生 Skill 套餐,还是该投入二开。

一、悟空 API 当前开放到什么程度

要先把「悟空开放了什么」这件事看清楚,不然后面所有讨论都是空中楼阁。当前悟空的开放能力大致分三档,从浅到深:

开放层级 能做什么 适合谁 改动成本
原生 Skill 包 调用钉钉已封装的能力(审批、考勤、文档、待办等) 不写代码、只配置 低,按页面配
自定义 Skill 写 HTTP 服务,让 Agent 调用自家接口 有后端开发能力的 IT 团队/服务商 中,按业务接口工作量
数据源接入 把数据库/数仓里的结构化数据按字段、权限暴露给 Agent 查询 已经有数据中台的中大型企业 中高,需要数据建模配合

三档不是替代关系,更像是组合关系。一个真正用得起来的悟空,往往是「原生 Skill 处理标准动作 + 自定义 Skill 接自家业务接口 + 数据源接入解决跨系统报表查询」三件套同时上。

值得注意的是,悟空的能力清单仍在快速迭代,建议在评估前到钉钉开放平台官方文档里对一遍当前可用接口列表,避免按半年前的资料做决策。本文只描述方法论和判断框架,不写死接口名和配额数。

二、把 Agent 接到自家 ERP 的 3 条路线

把悟空和自家 ERP/CRM 接起来,落地形态大致有三条路。哪条合适,要看你想让 Agent 在哪里出现、用户身份怎么管、业务系统能不能改动。

路线 A:原生 Skill 包装。 适合 ERP/CRM 已经有标准开放 API、且你不希望大改的场景。做法是写一层薄薄的中间层,把 ERP 的查询接口包成符合钉钉 Skill 规范的 HTTP 服务,注册成自定义 Skill 挂到悟空里。员工在悟空对话框里问「A 客户的应收账款余额是多少」,悟空识别意图后调用你写的中间层,中间层去 ERP 取数返回。投入小、上线快,但能解决的问题以查询类为主。

路线 B:自定义 Skill 调用业务接口写动作。 这是查询路线的进阶,让 Agent 不仅能查,还能写——提交报销、创建客户、推进商机阶段、生成调拨单。这一档真正吃功夫,因为涉及写动作时必须把权限、审批流、防误操作机制全部考虑进去,不能让 Agent 随便代下游员工签字。具体做法可以参考 AI Agent 在钉钉/CRM/ERP 里跟单的完整路径 里讲过的「读权限和写权限分级控制」。

路线 C:反向把悟空当能力嵌进自有应用。 前两条路线是「让悟空连业务系统」,这一条是反过来——业务系统的某个界面里嵌入悟空对话能力,让员工在自家系统里就能调用 Agent。比如 CRM 客户详情页右侧放一个对话区,业务员在里面问「这个客户最近的拜访记录」「下次拜访建议带什么资料」,背后跑的还是悟空的推理引擎,但用户感知是在自家系统里完成的。这条路线在数据安全策略严格的企业里更有优势,因为对话流可以全程在自家系统里留痕。

三条路怎么选?小结一张判断表:

场景 优先路线 备注
只想让员工能在钉钉里问数 A 投入最小,上线最快
想让 Agent 替员工提交简单单据 B 必须叠加审批兜底
数据敏感度高、要在自家系统留痕 C 嵌入成本中等,体验完整
既要在钉钉用、又要在 ERP 里用 A+C 组合 一套 Skill 服务,两个入口

三、数据接入:知识库 RAG 和结构化查询的混合架构

这是悟空二开里最容易翻车的地方。很多团队上来就把所有数据都怼进知识库,结果发现 Agent 答静态文档准,答动态业务数据全是幻觉。原因很简单:RAG 适合非结构化文本,不适合实时业务数据。

合理的分工是:

  1. 静态、文本型、变化慢的内容走知识库 RAG:产品手册、SOP、销售话术、政策制度、培训资料、历史案例库。这类内容上传到悟空知识库,Agent 通过向量检索回答。
  2. 实时、结构化、有强一致性要求的数据走自定义 Skill 调业务接口:库存、回款、订单状态、客户档案、考勤记录、报表数字。这类数据让 Agent 通过 HTTP 接口实时查询。
  3. 半结构化、需要复杂查询的报表走数据源接入:经营驾驶舱、月度业务回顾、销售漏斗分析。这类查询如果硬塞自定义 Skill,每个查询都要单独开发,工作量爆炸。更好的做法是把数据仓库的语义层暴露给 Agent,让它自己拼 SQL。

三种数据通道怎么协同?给一个典型的对话流程例子:员工问「华北区上个月 TOP10 客户的回款情况」,Agent 先去数据源接入档拉销售排行,再针对每个客户去 ERP 业务接口取实时回款,最后从知识库里拉风险等级判断规则做出综合答复。这种「混合架构」才是悟空二开真正发挥价值的形态。具体的混合方案可以参考 企业 AI Agent 数据安全要怎么做 里关于数据分层的讨论。

四、权限映射:悟空里的用户身份怎么和 ERP 对齐

这一节是整个二开里最关键的安全点,做错了轻则数据越权,重则被审计责令下线。

钉钉悟空里的用户身份是钉钉 UserID,自家 ERP 里是 ERP 账号,CRM 里又是 CRM 账号。Agent 调用业务接口时,必须知道「现在是谁在问」,且这个身份要能映射到 ERP/CRM 的权限体系里。

常见的几种做法:

映射方式 优点 风险
服务账号统一调用 实现简单,一个 token 走天下 越权严重,所有人都能看所有数据
通过工号字段反查 利用已有的工号-账号映射表 工号未维护或重复时易出错
OAuth 二次授权 用户自己授权,权限最准 体验割裂,每次都要点同意
单点登录账号体系 钉钉 + ERP 共用同一套 IdP 实施前提是已经有统一身份

中型企业的稳妥路径是先盘账号体系:销售-CRM、财务-用友/金蝶、HR-自研,一张映射表整理出来才能动手。如果连这张表都梳理不出,硬上 Agent 等于把 ERP 当裸奔接口暴露给悟空,迟早出事。已经做过 钉钉和金蝶打通的实施细节钉钉和用友的对接路径 的团队,这一步会快很多,因为身份映射的脏活已经在第一次集成时清过一遍。

还要补一句:写动作类 Skill(提交单据、修改数据)一定要在 Agent 调用前加一道人工确认,不要相信「大模型理解力强不会做错」。所有写操作都过审批流,对账系统里要能查到「这条记录是悟空 Skill X 在 Y 时刻代用户 Z 提交的」。

五、调试与上线:沙箱、灰度、日志追踪三件套

自研 Skill 不是写完就丢生产,正经的上线流程要走三件套。

沙箱环境。 钉钉开放平台有开发者沙箱,新写的 Skill 先注册成「内测应用」,只开放给开发者本人和测试同事。在沙箱里把对话流跑通——Agent 能不能正确识别意图、参数提取得对不对、错误响应能不能优雅返回——再考虑出沙箱。

灰度发布。 出了沙箱不要全员铺,先开 10% 用户、跑一周、看数据。建议至少观察:Skill 被调用的次数、调用成功率、用户复问率(同一个问题被反复问意味着上一次答得不好)、用户主动给的反馈。这一周里大概率会发现一些上线前没想到的边界情况——比如某种特殊客户编码 Agent 解析不出来,某个老业务接口超时——这些都得先修了再扩大灰度。

日志追踪。 每次 Skill 调用都要落三条日志:Agent 收到的原始问题、Agent 解析后的调用参数、业务接口返回的结果。出问题排查时这三条缺一不可。建议把这套日志直接对接到企业现有的可观测体系(Grafana/Loki/ELK 都行),不要独立成一个孤岛。

整个流程跟传统 IT 项目灰度上线很像,区别在于 Agent 项目的「正确性」很难用单元测试穷举,必须靠灰度期的真实用户反馈倒逼调整。

六、自研 Skill 和悟空 Skill 市场的区别

钉钉开放平台有一个 Skill 市场,里面已经有不少现成的 Skill 包——会议纪要、智能客服、培训问答等。什么时候直接用市场里的、什么时候自研?给一张对照表:

维度 市场 Skill 自研 Skill
上线速度 几小时 1-4 周
适配自家流程 通用流程为主 完全贴合
数据安全 依赖供应商承诺 自己掌控
持续迭代 跟供应商节奏 自己排期
长期成本 订阅费随用户数涨 一次性投入+运维
退场难度 低,停订就走 中,资产留在自家

不是非此即彼。常见组合是「通用能力用市场 Skill 起步,业务特异性强的部分自研补」。比如智能客服可以先用市场 Skill 跑 FAQ,复杂工单查询则自研 Skill 直连工单系统。这个组合策略和我们在 SaaS 还是定制开发的边界判断 里讲的混合架构思路是一致的。

七、什么团队/什么场景值得走 API 二开

不是所有企业都该自研 Skill。给一个相对务实的判断框架。

值得走二开的场景:

  • 业务系统已经有规范的开放 API,不是裸数据库
  • 有 1-2 名能写后端的工程师,且没被日常需求挤死
  • 有一个被高频问的业务场景,原生 Skill 解决不了(例如每天都要问的「客户回款」「门店实时库存」)
  • 数据安全要求高,不接受敏感数据上第三方 SaaS Skill
  • 后续还会有 5-10 个类似场景待接入,单点改造能形成可复用资产

建议先用市场 Skill 凑合的场景:

  • 业务系统连开放 API 都没有,要自研 Skill 得先做 ERP 二开
  • IT 团队只有 1-2 人,已经在维护一堆系统
  • 只有一个孤立场景,做完就用不上别的
  • 当前的悟空使用频率还很低,老板自己都没想清楚要它干啥

中型团队(30-150 人)真正适合的姿势是:先用 1-2 周做一个最小可用的自定义 Skill,对接最痛的那个业务接口,看真实使用频率。三个月内如果调用量稳定上升、用户反馈说「离了它干活变慢」,就是该追加投入的信号。如果数据持续低迷,说明这个场景本来就不该 Agent 化。这种「小步快跑」的逻辑和 AI Agent 落地的整体路线 里讲的小切口起步是同一个思路。

八、AI Coding 让二开成本不再等比例贵

要不要做自研 Skill 这件事,过去两年判断标准变了。早期一个工程师 2-3 周才能交付的 Skill,今天用 Cursor、Claude Code、通义灵码这类 AI 编码工具辅助,1-2 周可以出第一版。这不是吹牛,主要省下来的工作量在:

  1. 接口适配代码:把 ERP 接口的入参出参转换成 Skill 规范,AI Coding 工具能直接读 OpenAPI 文档生成 80% 的胶水代码
  2. 错误处理:try-catch、超时、重试、降级,这些标准模式由 AI 写比人写更全
  3. 测试用例:让 AI 根据接口文档生成 mock 数据和测试 case,覆盖率比人工写更高
  4. 文档:Skill 上线必须配的使用说明、参数说明、错误码说明,AI 帮你生成初稿

我们做过几个悟空 Skill 项目,AI Coding 介入后,单个原子 Skill 的人天投入大约从 8-12 人天降到 4-6 人天,节省的工时主要花在更值钱的地方——业务逻辑梳理、权限设计、灰度复盘。这一点和我们在做 企业 AI Agent 成本控制 时的观察一致:真正贵的从来不是写代码本身,而是搞清楚要写什么。

如果你之前因为「二开太贵」而搁置了悟空 API 路线,现在值得重新算一下账。一个能写后端的工程师配上 AI Coding 工具,覆盖原本需要外采服务商的工作量已经不是难事。

九、悟空二开自检清单

把前八节的判断点收成一张可带走的清单。逐条打勾,能勾上 5 个以上再启动二开项目。

  • 业务系统有规范的开放 API,文档齐全(不是「让我去问下原厂」)
  • 用户身份映射方案已经想清楚,不是用服务账号一把抓
  • 已经识别出至少 1 个高频业务场景,原生 Skill 解决不了
  • 有专人负责 Skill 服务的日志和可用性,不是上线就没人管
  • 业务接口的 QPS 承压能力评估过,不会被 Agent 触发打挂
  • 写动作类 Skill 全部接审批兜底,不让 Agent 裸奔
  • 沙箱-灰度-全量的上线流程已经走通,不是一把梭到全员
  • 知识库和实时数据分工清晰,不把动态业务数据丢 RAG
  • AI Coding 工具链已经在团队里铺开,单 Skill 工时控得住
  • 老板对悟空二开的预期是「降本增效」而非「替代员工」

如果勾不到 5 项,建议先把基础建设补齐再启动二开,不然项目大概率半途而废。可以先去 钉钉悟空企业落地指南 把基础场景跑顺,再考虑动 API。

十、写在最后

悟空 API/二开这条路,本质是把通用 Agent 框架和自家业务系统的耦合度推到更深一层。原生 Skill 包是别人定义的能力清单,自定义 Skill 是把自家业务接口翻译成 Agent 能懂的语言,数据源接入是把数据底座暴露给推理引擎。三档能力组合得当,悟空才能从「一个会聊天的工具」变成「一个能帮员工干活的同事」。

这条路不便宜,但也没到吓人的地步。当前的判断框架已经很成熟:先盘自家业务系统的 API 健康度、盘 IT 团队的工程能力、盘真正高频被问的业务场景,再决定是租市场 Skill 还是自研。中间路线永远是最务实的——通用能力用现成的,业务特异性强的部分自己长。剩下的,就是让 AI Coding 把那些原本占大头的胶水代码、错误处理、文档工作量降下来,让工程师把精力花在搞清楚业务逻辑、设计权限映射、复盘真实数据这些机器替不了的事情上。

常见问题

基于这个话题最常被问到的 4 个具体问题

Q1. 5 人左右的 IT 团队,能不能自研钉钉悟空 Skill?

可以,但要选对切口。建议从一个边界清晰的业务接口起步,比如「查库存」「查回款」「报工提交」,先做一个原子 Skill 跑通调用链,再考虑扩成 Skill 套件。一个能写 Node/Python、熟悉 OAuth 和钉钉鉴权的工程师 1-2 周可以交付第一个能用的 Skill,前提是业务接口本身规范、文档齐全。

Q2. 悟空 Skill 开发主要用什么语言?需要懂前端吗?

后端语言不挑,能起 HTTP 服务就行,主流团队用 Node.js、Python、Java、Go 都见过。前端基本不用碰,因为 Skill 本身在悟空里以对话形态呈现,回参只要按规定的 JSON Schema 返回即可。真正的难点不在语言,而在把业务接口的入参出参收敛成 Agent 可理解的结构化描述。

Q3. 悟空 API 的调用配额会不会成为瓶颈?

对中小规模团队(日均几百到几千次 Skill 调用)基本不会,按当前公开的开发者额度跑业务流程足够。瓶颈通常不在悟空侧,而在被调用的业务接口上——比如 ERP 的库存查询接口本来 QPS 就低,被 Agent 高频触发后反而是 ERP 先扛不住。规划阶段就要把业务接口的承压能力一起算进去。

Q4. 自研的 Skill 上线之后,运维谁来负责?

建议从立项就明确「Skill = 业务系统的对外门面」这条边界。Skill 服务本身的可用性、日志、限流由开发团队负责;底层业务接口的可用性由原 ERP/CRM 团队负责;用户反馈和提示词调优由业务方接口人负责。三方权责清晰,出了问题才不会互相甩锅。

开沿研发中心

开沿研发中心

开沿科技的方法论与技术团队,把一线交付中的经验沉淀成可复用的方法。了解研发中心 →

4
深耕企业数字化交付
800+ 单
累计项目交付
600+ 家
服务企业客户
钉钉认证
官方认证服务商
把方法用起来

想就你公司当前的状况,聊一下下一步从哪切

看完文章你应该能判断大方向。如果想就具体场景再细聊「第一步先做哪个 / 现有系统能不能复用 / 大概多长周期」,可以加我们顾问微信——30 分钟,免费方案诊断。

看客户案例