某制造企业销售主管打开 AI 助手,输入「帮我写一个跟进客户的话术」,AI 给了段四平八稳的通用文案,他看完叹气:「这跟没写一样。」隔壁工位 HR 让 AI 筛 30 份简历,输入「找出合适的候选人」,AI 推了 5 个名字,但说不清为什么是这 5 个、是不是漏了关键候选人。再往里走,财务对账员让 AI 「核对一下这两张表」,AI 输出了一堆「数据看起来基本一致」的废话。
不是 AI 不够强,是 Prompt 没写好。我们在客户项目里见过太多类似场景:花预算买了 AI 工具,员工用两周觉得「也就那样」,工具闲置。问题不在工具,在「人不会问」。同一个模型,A 员工问出的结果可以直接用,B 员工问出的结果只能丢掉重做,差距就在 Prompt 的 4 个要素是否齐全。
好 Prompt 的 4 要素:背景、任务、约束、样例
我们把「能用」的 Prompt 拆开看,几乎都有同样的骨架。不是玄学,是结构。
背景(Context):你是谁、对方是谁、当前在什么环节、有哪些既有信息。AI 不知道你公司是做什么的、客户是新客还是老客,你不说它就只能按平均水平猜。
任务(Task):要 AI 输出什么。是「写一段话」「列 5 个选项」「填一张表」还是「判断是否符合条件」。动词越具体越好,「分析一下」是最差的动词。
约束(Constraint):字数、语气、格式、禁忌、必须包含的要点。约束越多,AI 越能聚焦在你想要的范围里。
样例(Example):给一两个「好的输出长这样」的范本。这是新手最容易忽略的一项,但加上样例后,AI 输出质量往往跳升 50%。
下面这张表对比了「四要素不全」和「四要素完整」的差异:
| Prompt 形态 | 输出特征 | 可用性 |
|---|---|---|
| 只有任务(帮我写跟进话术) | 通用模板,与具体客户无关 | 几乎不可用 |
| 任务+背景(这个客户是 XX 行业老客户) | 有针对性,但语气和长度不可控 | 改一下能用 |
| 任务+背景+约束(限 200 字,避免提折扣) | 接近可用,偶尔跑偏 | 70% 能直接用 |
| 任务+背景+约束+样例 | 风格一致,可批量生产 | 90% 可直接用 |
记住这 4 要素,下面 4 个业务场景的模板就是它的具体落地。
场景一:销售跟进话术生成 Prompt
销售是 Prompt 应用的最高频场景,因为每天要写几十段差异化话术,最适合 AI 加速。但「帮我写一段跟进客户的话」这种问法只会得到废话。
把它改写成结构化 Prompt:
[背景]
你是一名 B2B 软件销售。
客户:制造业,员工规模 200-500 人,是我们的老客户,去年采购过 ERP 模块。
最近动态:上周客户技术负责人在我们的演示会上停留较久,问了关于 MES 集成的问题。
当前阶段:演示后第 3 天,需要主动跟进。
[任务]
写一条企业微信跟进消息,引导客户进入下一步「约一次现场调研」。
[约束]
- 控制在 150 字以内
- 语气专业、不卑微、不催促
- 不提折扣或限时优惠
- 开头不要用「您好」「打扰了」等套话,直接进入价值
- 结尾给一个具体的下一步动作(约时间)
[样例]
张总,上周演示后我们整理了 3 家同规模制造企业 MES+ERP 集成的实际案例,
里面有一份排产逻辑的对比表,跟您提到的车间齐套问题相关。
我下周二或周四下午可以去您工厂走一圈,顺便把案例带过去当面对照,
方便约一个时间吗?
这套模板的关键在「样例」段——它教 AI 你公司的话术风格。一旦在企业内部沉淀 10-20 条样例,所有销售用同一套 Prompt 都能输出风格一致的内容。延伸阅读可以参考我们写过的钉钉 SCRM 私域玩法,里面有更多话术运营细节。
场景二:HR 简历筛选 Prompt
HR 用 AI 筛简历的核心矛盾是「不能漏掉合适的人,也不能浪费时间看不合适的人」。Prompt 写不好,AI 就成了随机筛选器。
可复用模板:
[背景]
我们在招一个「售前解决方案顾问」,岗位要求:
- 有 3 年以上 B2B 软件售前或交付经验
- 懂制造业或零售业其中一个
- 有客户现场调研、方案撰写、Demo 演示完整经验
- 加分项:有 ERP/MES/CRM 相关项目经历
[任务]
我会发给你一份简历的纯文本,请按以下 5 个维度打分(1-5 分):
1. 行业匹配度
2. 经验年限匹配度
3. 售前完整链路覆盖度
4. 加分项命中数量
5. 综合推荐度
并给出 3 条关键判断依据(直接引用简历原文)。
[约束]
- 不要编造简历里没有的信息
- 如果某个维度信息不足,写「简历未明确」,不要猜
- 综合推荐度只能是「强烈推荐」「值得面试」「待定」「不匹配」四档
- 输出用表格
[样例]
| 维度 | 分数 | 依据 |
| --- | --- | --- |
| 行业匹配度 | 4 | 简历提到「服务过 3 家汽配零部件厂」 |
...
综合推荐度:值得面试
约束里那句「不要编造」非常关键——没有它,AI 经常会脑补「具有良好的沟通能力」这种简历里压根没写的话。HR 一旦相信了 AI 编的「能力标签」,整个筛选就崩了。这种「AI 自由发挥」的风险,在AI 业务分析的真相里我们专门拆过。
场景三:财务对账 Prompt
对账是 AI 最容易「水化」的场景。让 AI 「核对一下两张表」,它会很客气地说「整体一致,存在少量差异」,但这等于没说。
可复用模板:
[背景]
我有两份数据:A 表是系统导出的应收账单(含订单号、金额、客户、开票日期);
B 表是客户回款记录(含客户、回款金额、到账日期、备注)。
两份数据在客户主体名称上偶尔有简称差异(如「XX 公司」vs「XX 有限公司」)。
[任务]
请按客户主体匹配两表,输出 3 张清单:
1. 已完全核销(金额一致、可对应)
2. 部分核销(金额不一致,给出差额)
3. 无法匹配(A 表有 B 表无,或反向)
[约束]
- 客户主体匹配时容忍「简称-全称」差异,但必须在结果里标出原始名称
- 金额差异超过 100 元的必须单独列出,不能合并
- 不要给「建议」,只输出事实
- 输出三个独立表格,不要混在一起
- 末尾给一段不超过 50 字的「需人工复核事项」
[样例]
(贴一个已完全核销的样例行+一个差额行)
这里多说一句:财务场景的 Prompt 必须把「不要给建议」写进去。AI 默认会在末尾加一段「建议加强对账流程」之类的废话,财务每天看 100 次就会麻木,反而错过真正需要关注的异常。底层逻辑可以参考我们写过的企业数据治理的第一步。
场景四:项目周报生成 Prompt
项目经理写周报的痛点不是写字慢,是「想不起来这周到底做了什么」。把碎片化的工作日志和会议记录扔给 AI,让它生成结构化周报,是高频高价值场景。
可复用模板:
[背景]
我是 XX 项目(ERP 实施)的项目经理。
项目状态:实施期第 6 周,关键里程碑是月底的 UAT 启动。
我会粘贴本周的:① 日报片段 ② 会议纪要 ③ 任务管理工具的更新记录。
[任务]
生成一份给客户高管看的周报,结构如下:
- 本周关键进展(3-5 条,量化)
- 风险与依赖(标注「需客户配合」「需我方解决」)
- 下周计划(3-5 条,含负责人和截止时间)
- 给客户高管的 1 句话总结
[约束]
- 关键进展每条必须带数字或具体动作(不能写「持续推进」)
- 风险条目必须给「应对动作」,不能只描述风险
- 不要用「我们」「咱们」,用「项目组」「客户方」
- 总字数控制在 600 字以内
- 不要表扬团队,客户看的是事实不是情绪
这套模板的精髓是把「客户视角」写进约束。同样的工作内容,写给老板看的周报和写给客户看的周报语气完全不同,AI 默认不知道。把「读者是谁」明确告诉 AI,输出质量立刻分层。
Prompt 模板沉淀:从个人技巧到企业资产
单个员工写出一条好 Prompt 只是起点,企业真正的价值是「让所有员工都能复用这条 Prompt」。
我们见过两类截然不同的状态:
A 公司:每个员工各自在 ChatGPT 里改 Prompt,离职带走,新人入职从零摸索,永远在重复造轮子。Prompt 散落在个人聊天记录里,公司没有任何沉淀。
B 公司:把 Prompt 放进企业内部的知识库或 AI 中台,按「销售/HR/财务/PMO」分类,每个模板标注「适用场景、输入要求、输出示例、迭代版本」。新员工入职第一天就能用上前辈打磨过的模板。
下面这张表是我们建议的 Prompt 资产化分层:
| 层级 | 谁来维护 | 更新频率 | 示例 |
|---|---|---|---|
| 个人草稿 | 员工自己 | 每天 | 临时 Prompt、实验 |
| 部门模板 | 部门负责人 | 双周 | 销售跟进话术、HR 筛简历 |
| 公司模板 | AI 治理小组 | 月度 | 涉及合规、对外文案、统一品牌话术 |
| 高敏 Prompt | 信息安全+业务高管 | 季度 | 含定价策略、客户分层逻辑 |
Prompt 一旦进入「公司模板」层,就要走类似代码评审的流程——这部分参考逻辑跟AI Coding 技能库讲的代码资产化逻辑接近,可以一起看。
Prompt 维护:模型升级了模板要不要重写
这是企业最担心的成本问题:花半年沉淀的 Prompt 资产,会不会模型一升级就作废?
我们的实战观察是:80% 的 Prompt 在模型小版本升级时不需要改,因为四要素结构是普适的。需要调整的情况主要是三类:
| 升级类型 | 模板需不需要改 | 改什么 |
|---|---|---|
| 模型小版本升级(如 4.5 → 4.6) | 一般不需要 | 抽查输出风格是否漂移 |
| 模型大版本升级(如 4.x → 5.x) | 部分需要 | 简化冗余约束,模型理解力更强了 |
| 换模型供应商 | 多数需要 | 重写样例段、检查特殊符号兼容 |
| 业务场景变化 | 必须改 | 重新校准背景和样例 |
实操建议是建立一个「Prompt 回归测试集」:每个核心模板配 5-10 组典型输入和预期输出,模型一升级就跑一遍,输出偏差超过阈值就触发人工复核。这跟软件回归测试是一个思路,区别只是测的不是代码而是 Prompt。
什么场景 Prompt 救不了:必须走 Agent 路径
不是所有问题都能靠 Prompt 解决。下面这个自检清单帮你判断什么时候该停止打磨 Prompt、改用 AI Agent:
信号 1:任务需要分多步执行,每步结果影响下一步(如「先查库存再下采购单再通知仓库」)。Prompt 是单次对话,做不了状态机。
信号 2:需要调用外部系统的实时数据(ERP、CRM、邮箱)。Prompt 只能处理你贴进去的文本,不能主动取数。
信号 3:需要根据条件分支(如「如果客户金额 > X 则走 A 流程,否则走 B」)。Prompt 能写判断,但不能可靠地执行。
信号 4:要求审计和留痕(每一步谁触发、做了什么、改了什么数据)。Prompt 没有日志体系。
信号 5:要让多个员工以一致结果调用(不能因为换个人输入就跑偏)。
只要命中其中 2 条,就该考虑 AI Agent 而不是堆 Prompt。这条分界线我们在AI Agent 实施路线图和AI Agent 落地前置自检里讲得更系统,可以延伸阅读。简单说:Prompt 是「单次对话」,Agent 是「带流程、带工具、带记忆的执行体」。两者不是替代关系,而是分工。一个成熟的企业里,80% 的轻量场景靠 Prompt 模板,20% 的关键流程靠 Agent。
写在最后
Prompt 工程听起来玄,本质是「把脑子里那点业务直觉,翻译成 AI 能复现的语言」。会写 Prompt 的员工不是技术好,是「能把活说清楚」的那一批人——这本来就是好员工的特征,AI 时代只是把这件事的杠杆放大了。
对企业来说,与其等所有员工自学成才,不如做三件事:把 4 类高频场景的模板沉淀进知识库,让新人开箱即用;建立模板的迭代和评审机制,好用的留下、过时的下架;划清 Prompt 和 Agent 的边界,关键流程别试图用一句长 Prompt 硬撑。这事跟当年「不会用 Excel」是一个量级的分水岭,区别只是这次门槛更低,错过的代价更高。




