在 2025 年的 10 月份，Anthropic 发布了 Claude 模型的一项重大更新的 Agent Skills，它允许用户将专业知识、脚本和资源打包成模块化的“技能文件夹”（Skill folders），让 AI 能在特定工作场景中更专业地执行任务。

如果我们在做行业 Agent、内部 Copilot、或想把 Claude Code / API 用在业务里，那就需要我们在做之前把「Skill」和「行业 Workflow」这两件事想清楚，并知道从哪里下手。

1. Skill 和行业 Workflow 的概念

1.1 Skill 是什么？

简单说：

Skill = 给模型的一份可复用「操作说明书 + 流程模板」

在 Claude 体系里，Skill 是一个带 SKILL.md 的文件夹，它告诉模型：
“在什么情况下该用我、我要完成什么任务、要按什么步骤做、输出要长什么样。”

特点有几个：

面向具体任务，不是一个抽象的「能力标签」
例如：生成符合公司品牌规范的 PPT，按照内部代码规范重构文件，按财务模板做对账报告。
本质上是文字写清楚的 SOP + 可选的脚本
主体就是 Markdown 文档，有需要时再绑上 Python 脚本去做确定性处理。
可以被模型自动发现和按需加载
模型不会一直把完整 Skill 塞在上下文里，只在命中时再读取详细内容。

它和我们平时说的「提示词」的区别在于：
提示词是一次性、散落的；Skill 是结构化、可版本化、可共享的。

1.2 行业 Workflow 是什么？

Workflow 可以理解为：

把行业中的业务流程，做成清晰的步骤编排和 IF-ELSE 逻辑。

过去这些东西已经存在于：

各种脚本、RPA、BPM 系统
系统之间的 API 调用编排
内部运维 / 运营同学脑子里和文档里的 SOP

在 Agent 语境下，我们关心的是一件事：

怎么把这些已有流程封装成「可由 Agent 触发、可观测、可审计」的工作流节点。

行业 Workflow 的关键特征：

强约束：
对输入 / 输出有严格格式要求，执行过程里有清晰的分支、回滚、告警。
强依赖业务 Know-how：
为什么要这样分支，Why 在流程里，而不是在模型参数里。
长期稳定运行：
一旦跑到生产，就不希望被大模型的「心情」影响。

2. Claude Code 的 Skill

在 Claude 的整体设计里，Skills 是一个非常核心的扩展机制。它解决了两个问题：

如何在不撑爆上下文的前提下，给模型装很多垂直能力？
如何让业务团队通过“写文档”的方式，而不是“写模型”的方式扩展能力？

2.1 一个 Skill = 一个带 SKILL.md 的文件夹

Claude 官方定义里，一个 Skill 的最小单元就是：

一个文件夹
里面一个 SKILL.md
也可以再带一些脚本、资源文件

官方给出的模板是这样的：

---
name: my-first-skill
description: 这是一个关于此 Skill 能做什么以及何时使用它的清晰描述。
---
# 我的第一个 Skill

[在这里添加您的指令，Claude 在激活此 Skill 时会遵循这些指令]

## 示例
- 用法示例 1
- 用法示例 2

几个要点：

name：唯一标识，最好跟任务直接相关。
description：非常重要，模型靠这个来判断「什么时候用你」。
正文部分：
写清楚目标、步骤、注意事项、输出格式、示例。

只要这一个 Markdown 写好了，一个可用 Skill 就成立了，不需要额外的配置文件。

2.2 具体例子：PPT Skill

官方仓库里有一个 PPTX 相关的 Skill，SKILL.md 类似下面这种结构：

YAML Frontmatter：说明 Skill 名称、用途（处理 PPTX）
正文：分章节写
- 如何解析 PPTX
- 如何修改版式
- 如何保证品牌颜色与模板统一
- 输入 / 输出约定
- 示例调用方式

Claude 的做法是：

会话启动时，只把所有 Skill 的 name + description 读一遍，放到系统级提示里。
当用户输入与某个 Skill 的描述高度匹配时，Claude 再去把这个 Skill 的完整内容加载到上下文中。

这就是文档里提到的「渐进式披露（Progressive Disclosure）」机制。

2.3 渐进式披露

这个词其实有点装，但装得有点厉害，使用这种方式的原因很直接：Token 成本和性能。

初始加载时，每个 Skill 只占用几十个 Token（元信息）。
真正用到的时候，才把 SKILL.md 的主体搬进来。
如果 Skill 还拆成多个文件，Claude 只会读当前任务需要的那部分。

结论：我们可以放心装很多 Skill，而不用太担心上下文被占满。

2.4 Skill 里可以带代码

文档里也提到，Skill 可以带 Python 脚本等可执行文件。

用途主要有两类：

做确定性计算 / 校验
- 排序、过滤、格式校验
- 比如：生成 GIF 之后检查文件大小是否符合 Slack 限制
做简单的集成调用
- 调一个内部 API
- 读取一个本地文件，然后把内容返给模型

设计上，有一条很实用的边界：

流程和策略写在 SKILL.md
需要 100% 确定性 的步骤写在脚本里

模型不负责「每次都从零写代码」，而是调用你已经写好、已经验证过的代码。

3. Skill 和 Tool / MCP 的边界

很多人会把 Skill、Tool、MCP 混在一起，这里做个简单对比方便后面聊 Workflow。

3.1 Skill：教模型「怎么做」

把我们的 SOP、套路、模板，变成模型可执行的说明书。
适合：
- 结构化写作
- 格式转换
- 合规校验
- 数据清洗 / 整理
优点：
- 写文档就能做定制
- Token 成本可控
- 容易版本化和团队共享

3.2 MCP / Tools：帮模型「去做」

MCP 解决的是：如何以统一协议，让模型调用外部系统 / 数据源 / API。
它关注的是：
- 怎么查 GitHub
- 怎么调 CI/CD
- 怎么查数据库
- 怎么发 Slack 消息

简要总结就是一句话：Skill 面向流程，MCP 面向集成。

3.3 Skill + MCP 的组合

在一个典型任务里：

MCP 负责：拿到需要的数据、执行动作
Skill 负责：拿到这些结果后怎么分析、怎么生成符合规范的输出

这其实已经非常接近我们后面要讲的「Workflow + Agent」的拆分思路。

4. 行业 Workflow：Skill 落地的载体

前面讲的是 Skill 这一颗颗能力点”，接下来要看它们怎么和行业 Workflow 结合。

4.1 Agent 是交互方式，不是业务本身

再强调一次我们之前文章中的观点：Agent 是交互方式，不是业务本身

在行业里，Agent 更适合作为：

自然语言入口
意图理解与参数提取
初步判断和分发

真正的行业壁垒在于：

我们内部沉淀的 SOP
历史案例和边缘场景处理方式
审批链路和风控规则

这些东西，应该放在：

Workflow 编排系统
规则引擎
Skill + MCP 的组合

而不是「指望一个通用 Agent 自己学出来」。

4.2 为什么不能纯 Agent？

幻觉和确定性冲突
- 行业里很多流程（财务、生产、安全）对错误零容忍。
- 1% 的错误率，对于 Demo 可以接受，对生产不行。
过程黑盒，难以审计
- Agent 的推理链路在模型内部
- 出现问题难以复盘和归责
- 很难满足合规和审计要求
成本和延迟
- 让模型去规划每个按钮、每个 if-else，是在烧算力
- 这些确定性逻辑用传统代码 / Workflow 做更合适

所以，在企业 / 行业场景里，更现实的模式是：

Workflow + Agent
Agent 做理解和决策，Workflow 做执行和兜底。

5. 「Workflow + Agent」的混合架构

把前面的点合起来，可以得到一个常见的分层结构。

5.1 顶层：意图理解与路由（Agent）

职责只有三件：

理解用户在说什么（意图识别）
把需要的参数补齐（参数提取 + 追问）
决定触发哪个 Workflow / Skill 组合（路由）

流程可以简单画成：

用户 → 自然语言
→ Agent：识别意图 + 提取参数
→ 选中对应 Workflow（或再转给某个二级 Agent）
→ Workflow 执行
→ 结果交给 Agent 格式化给用户

这一步里，Skill 可以怎么用？

把「意图分类规范」「参数提取规则」「话术模板」写成一个 Skill
在 Skill 里明确：
- 出现哪些关键词 / 条件时，对应什么意图
- 提取不到关键信息时，按怎样的模板向用户追问

5.2 中间层：RAG + 决策

有些问题不能直接映射到单个 Workflow，需要先查知识再决定走哪条路。

典型例子：

“设备报警 E03，我该怎么办？”

步骤一般是：

Agent 调用 RAG，在知识库中检索 E03 的说明和处理方案。
Skill 里定义好：
- 如何解释错误码
- 不同错误码对应的处理选项
根据检索结果和规则，决定触发：
- 远程重启流程
- 提交工单流程
- 安排现场工程师流程

这里的组合关系是：

RAG：提供上下文知识
Skill：约束「如何做决策、如何提问、如何输出」
Workflow：完成最终执行动作

5.3 底层：确定性执行（Workflow / RPA / 脚本）

这一层的唯一要求：

不要信模型，要信代码和流程编排。

包括：

API 调用链
BPM 流程
RPA 机器人
定时任务
数据库操作事务

这里非常适合做成「Skill + MCP + Workflow」的组合：

Workflow 把一串 API / RPC / 脚本串起来
MCP 把外部系统包装成标准工具
Skill 负责：
- 输入规范
- 输出规范
- 错误处理策略
- 不同状态码的解释

最后返回给 Agent 的应该是：

清晰的状态（成功 / 失败 / 部分成功）
明确的字段（JSON 等结构化结果）
标准错误码和错误信息

5.4 最后一层：结果转述（Agent）

Agent 的工作只是：

把结构化结果翻译成人能看懂的话
必要时附上详细解释和后续建议
避免「编故事」，严格按返回字段说话

在这一步也可以挂一个简单 Skill：

统一输出口吻
统一敏感信息处理方式
统一错误提示文案

6. Skill 在行业 Workflow 里的落地方式

回到文章标题里的核心问题：行业 Workflow 如何通过 Skill 落地？

可以拆成三步。

6.1 把「人做事的方式」变成 Skill

先不碰系统，先去梳理：

关键流程当前是怎么执行的？
有哪些「资深同事会说：新人容易犯错的点」？
有没有文档 / 模板 / 复盘材料？

然后做的事情是：

挑出重复度高、流程相对固定的一批任务。
每个任务建一个 Skill 文件夹，写 SKILL.md：
- 场景描述：什么时候应该用这个 Skill？
- 输入要求：有哪些字段，格式是什么？
- 处理步骤：拆成 1、2、3…
- 输出规范：JSON 字段 + 人类可读的模板
- 示例：2~3 个高频真实例子

第一轮不用追求覆盖所有流程，重点是把写 Skill 这件事本身跑顺。

6.2 把「系统做事的方式」变成 Workflow + MCP

接下来梳理现有系统资产：

哪些已有 API / 脚本 / RPA 可以直接复用？
哪些流程现在是人工填表 + 审批 + 抄数？
哪些操作有合规 / 风控要求，必须严格走系统？

然后做：

把可复用的系统能力包装成 MCP / 内部 API。
用我们熟悉的方式编排成 Workflow（BPM / 编排平台 / 自写 Orchestrator）。
明确每个 Workflow 的：
- 输入结构
- 输出结构
- 错误码定义
- 审计日志

这一步的原则是：

尽量少改存量系统，尽量通过「外面包一层」的方式让它变成可调用的 Workflow 组件。

6.3 用 Skill 把「人」和「系统」连起来

最后一步，把 Skill 作为桥梁：

上游：Agent 与用户对话
中游：Skill 指导 Agent 该怎么理解、怎么提问、怎么路由
下游：Workflow/MCP 真正执行动作

一个典型链路会变成：

用户输入需求
Agent 用「意图 Skill」判断任务类型
分发给对应领域 Agent
领域 Agent 读取对应 Skill：
- 补齐参数
- 调用 RAG 查规则
- 决定调用哪个 Workflow
Workflow 执行，通过 MCP / API 触达系统
返回结果由领域 Agent 按「输出 Skill」转成年类可读结果
Agent 统一封装成对用户的话术

所有「经验」、「SOP」、「注意事项」，尽量沉淀在 Skill 里：

方便以后版本升级
方便新业务线复用
方便做变更审计（Skill 本身可以版本控制）

7. 实施过程中的几个注意点

7.1 先把 Skill 写“够细”，再考虑自动化程度

很多团队上来就想着「全自动」，结果 Agent 兜不住，Workflow 无法覆盖异常，最后完全不敢放生产。

相对稳妥的节奏是：

用 Skill 把流程写细写透，先跑一段时间「人机协同」：
- Agent 给出建议
- 人来点确认 / 修改
统计哪些环节几乎没有人工干预
把这些环节下沉成 Workflow，逐步提高自动化比例

这样做有一个副作用：整个流程的「隐性知识」会被 Skill 强制写出来，对组织本身也是一种梳理。

7.2 旧系统是企业的「来时路」

很多看起来陈旧的：

定时脚本
报文接口
Excel 宏

从「Workflow + Agent」的角度看都是资产。
Skill 负责解释「什么时候、为什么、怎么用它」，MCP / Workflow 负责「怎么安全调用它」。

相比完全重构，一个实用的策略是：

给旧系统加一个 AI 适配层，而不是要求旧系统「变成 AI 原生」。

7.3 结构化数据回流

Agent 与用户的对话里，有大量可以反哺业务的信息：

用户真实需求
高频异常
流程里的瓶颈点
新出现的边缘场景

建议在设计时就准备好：

把关键字段结构化写入日志 / 数据库
定期用这些数据更新：
- Skill 内容
- RAG 知识库
- 流程设计（Workflow）

不要只留下聊天记录，要留下可分析的行为数据。

8. 小结

把前面的内容合在一起，其实可以简化为三条：

Skill 把「怎么做事」固化下来
- 它是 Agent 的“操作手册”
- 它让流程可以被描述、复用、版本化
Workflow 把「谁来做、何时做、按什么顺序做」编排起来
- 它对接真实系统和资源
- 它保证执行的确定性和审计能力
Agent 把「人类模糊的需求」翻译成「可以被 Skill + Workflow 执行的指令」
- 它是交互层和调度层
- 它不是行业壁垒本身

在这个结构下，“降本增效”不再是一个抽象口号，而是一个比较直观的路径：

过去那些无法自动化的非结构化需求（邮件、沟通、模糊指令），
通过 Agent + Skill 变成可结构化的任务描述，
再通过 Workflow + MCP 交给稳定的代码和系统去执行。

从研发团队视角看，这套东西真正改变的是工作方式：

从「写提示」变成「设计并维护一套可执行流程」；
从「做一次性 Demo」变成「搭一套能长期演进的智能基础设施」。

如果你正在做行业 Agent，或者准备在内部推一个 AI 助手，可以先从一件事开始：

挑一个你们团队最常做、步骤最清晰、但最浪费时间的任务，把它完整写成一个 Skill，再把现有系统封装成一个 Workflow。
这两个拼起来，基本就是你们自己的第一个「行业 Workflow + Agent」原型。

以上。

潘锦的空间

SaaS SaaS架构团队管理技术管理技术架构 PHP 内核扩展项目管理

AI Agent 的 Skill 和行业 Workflow