在 2025 年的 10 月份,Anthropic 发布了 Claude 模型的一项重大更新的 Agent Skills,它允许用户将专业知识、脚本和资源打包成模块化的“技能文件夹”(Skill folders),让 AI 能在特定工作场景中更专业地执行任务。
如果我们在做行业 Agent、内部 Copilot、或想把 Claude Code / API 用在业务里,那就需要我们在做之前把「Skill」和「行业 Workflow」这两件事想清楚,并知道从哪里下手。
1. Skill 和行业 Workflow 的概念
1.1 Skill 是什么?
简单说:
Skill = 给模型的一份可复用「操作说明书 + 流程模板」
在 Claude 体系里,Skill 是一个带 SKILL.md 的文件夹,它告诉模型:
“在什么情况下该用我、我要完成什么任务、要按什么步骤做、输出要长什么样。”
特点有几个:
-
面向具体任务,不是一个抽象的「能力标签」
例如:生成符合公司品牌规范的 PPT,按照内部代码规范重构文件,按财务模板做对账报告。 -
本质上是文字写清楚的 SOP + 可选的脚本
主体就是 Markdown 文档,有需要时再绑上 Python 脚本去做确定性处理。 -
可以被模型自动发现和按需加载
模型不会一直把完整 Skill 塞在上下文里,只在命中时再读取详细内容。
它和我们平时说的「提示词」的区别在于:
提示词是一次性、散落的;Skill 是结构化、可版本化、可共享的。
1.2 行业 Workflow 是什么?
Workflow 可以理解为:
把行业中的业务流程,做成清晰的步骤编排和 IF-ELSE 逻辑。
过去这些东西已经存在于:
-
各种脚本、RPA、BPM 系统 -
系统之间的 API 调用编排 -
内部运维 / 运营同学脑子里和文档里的 SOP
在 Agent 语境下,我们关心的是一件事:
怎么把这些已有流程封装成「可由 Agent 触发、可观测、可审计」的工作流节点。
行业 Workflow 的关键特征:
-
强约束:
对输入 / 输出有严格格式要求,执行过程里有清晰的分支、回滚、告警。 -
强依赖业务 Know-how:
为什么要这样分支,Why 在流程里,而不是在模型参数里。 -
长期稳定运行:
一旦跑到生产,就不希望被大模型的「心情」影响。
2. Claude Code 的 Skill
在 Claude 的整体设计里,Skills 是一个非常核心的扩展机制。它解决了两个问题:
-
如何在不撑爆上下文的前提下,给模型装很多垂直能力? -
如何让业务团队通过“写文档”的方式,而不是“写模型”的方式扩展能力?
2.1 一个 Skill = 一个带 SKILL.md 的文件夹
Claude 官方定义里,一个 Skill 的最小单元就是:
-
一个文件夹 -
里面一个 SKILL.md -
也可以再带一些脚本、资源文件
官方给出的模板是这样的:
---
name: my-first-skill
description: 这是一个关于此 Skill 能做什么以及何时使用它的清晰描述。
---
# 我的第一个 Skill
[在这里添加您的指令,Claude 在激活此 Skill 时会遵循这些指令]
## 示例
- 用法示例 1
- 用法示例 2
几个要点:
-
name:唯一标识,最好跟任务直接相关。 -
description:非常重要,模型靠这个来判断「什么时候用你」。 -
正文部分:
写清楚目标、步骤、注意事项、输出格式、示例。
只要这一个 Markdown 写好了,一个可用 Skill 就成立了,不需要额外的配置文件。
2.2 具体例子:PPT Skill
官方仓库里有一个 PPTX 相关的 Skill,SKILL.md 类似下面这种结构:
-
YAML Frontmatter:说明 Skill 名称、用途(处理 PPTX) -
正文:分章节写 -
如何解析 PPTX -
如何修改版式 -
如何保证品牌颜色与模板统一 -
输入 / 输出约定 -
示例调用方式
-
Claude 的做法是:
-
会话启动时,只把所有 Skill 的 name + description读一遍,放到系统级提示里。 -
当用户输入与某个 Skill 的描述高度匹配时,Claude 再去把这个 Skill 的完整内容加载到上下文中。
这就是文档里提到的「渐进式披露(Progressive Disclosure)」机制。
2.3 渐进式披露
这个词其实有点装,但装得有点厉害,使用这种方式的原因很直接:Token 成本和性能。
-
初始加载时,每个 Skill 只占用几十个 Token(元信息)。 -
真正用到的时候,才把 SKILL.md 的主体搬进来。 -
如果 Skill 还拆成多个文件,Claude 只会读当前任务需要的那部分。
结论:我们可以放心装很多 Skill,而不用太担心上下文被占满。
2.4 Skill 里可以带代码
文档里也提到,Skill 可以带 Python 脚本等可执行文件。
用途主要有两类:
-
做确定性计算 / 校验 -
排序、过滤、格式校验 -
比如:生成 GIF 之后检查文件大小是否符合 Slack 限制
-
-
做简单的集成调用 -
调一个内部 API -
读取一个本地文件,然后把内容返给模型
-
设计上,有一条很实用的边界:
-
流程和策略写在 SKILL.md -
需要 100% 确定性 的步骤写在脚本里
模型不负责「每次都从零写代码」,而是调用你已经写好、已经验证过的代码。
3. Skill 和 Tool / MCP 的边界
很多人会把 Skill、Tool、MCP 混在一起,这里做个简单对比方便后面聊 Workflow。
3.1 Skill:教模型「怎么做」
-
把我们的 SOP、套路、模板,变成模型可执行的说明书。 -
适合: -
结构化写作 -
格式转换 -
合规校验 -
数据清洗 / 整理
-
-
优点: -
写文档就能做定制 -
Token 成本可控 -
容易版本化和团队共享
-
3.2 MCP / Tools:帮模型「去做」
-
MCP 解决的是:如何以统一协议,让模型调用外部系统 / 数据源 / API。 -
它关注的是: -
怎么查 GitHub -
怎么调 CI/CD -
怎么查数据库 -
怎么发 Slack 消息
-
简要总结就是一句话:Skill 面向流程,MCP 面向集成。
3.3 Skill + MCP 的组合
在一个典型任务里:
-
MCP 负责:拿到需要的数据、执行动作 -
Skill 负责:拿到这些结果后怎么分析、怎么生成符合规范的输出
这其实已经非常接近我们后面要讲的「Workflow + Agent」的拆分思路。
4. 行业 Workflow:Skill 落地的载体
前面讲的是 Skill 这一颗颗能力点”,接下来要看它们怎么和行业 Workflow 结合。
4.1 Agent 是交互方式,不是业务本身
再强调一次我们之前文章中的观点:Agent 是交互方式,不是业务本身
在行业里,Agent 更适合作为:
-
自然语言入口 -
意图理解与参数提取 -
初步判断和分发
真正的行业壁垒在于:
-
我们内部沉淀的 SOP -
历史案例和边缘场景处理方式 -
审批链路和风控规则
这些东西,应该放在:
-
Workflow 编排系统 -
规则引擎 -
Skill + MCP 的组合
而不是「指望一个通用 Agent 自己学出来」。
4.2 为什么不能纯 Agent?
-
幻觉和确定性冲突 -
行业里很多流程(财务、生产、安全)对错误零容忍。 -
1% 的错误率,对于 Demo 可以接受,对生产不行。
-
-
过程黑盒,难以审计 -
Agent 的推理链路在模型内部 -
出现问题难以复盘和归责 -
很难满足合规和审计要求
-
-
成本和延迟 -
让模型去规划每个按钮、每个 if-else,是在烧算力 -
这些确定性逻辑用传统代码 / Workflow 做更合适
-
所以,在企业 / 行业场景里,更现实的模式是:
Workflow + Agent
Agent 做理解和决策,Workflow 做执行和兜底。
5. 「Workflow + Agent」的混合架构
把前面的点合起来,可以得到一个常见的分层结构。
5.1 顶层:意图理解与路由(Agent)
职责只有三件:
-
理解用户在说什么(意图识别) -
把需要的参数补齐(参数提取 + 追问) -
决定触发哪个 Workflow / Skill 组合(路由)
流程可以简单画成:
用户 → 自然语言
→ Agent:识别意图 + 提取参数
→ 选中对应 Workflow(或再转给某个二级 Agent)
→ Workflow 执行
→ 结果交给 Agent 格式化给用户
这一步里,Skill 可以怎么用?
-
把「意图分类规范」「参数提取规则」「话术模板」写成一个 Skill -
在 Skill 里明确: -
出现哪些关键词 / 条件时,对应什么意图 -
提取不到关键信息时,按怎样的模板向用户追问
-
5.2 中间层:RAG + 决策
有些问题不能直接映射到单个 Workflow,需要先查知识再决定走哪条路。
典型例子:
“设备报警 E03,我该怎么办?”
步骤一般是:
-
Agent 调用 RAG,在知识库中检索 E03 的说明和处理方案。 -
Skill 里定义好: -
如何解释错误码 -
不同错误码对应的处理选项
-
-
根据检索结果和规则,决定触发: -
远程重启流程 -
提交工单流程 -
安排现场工程师流程
-
这里的组合关系是:
-
RAG:提供上下文知识 -
Skill:约束「如何做决策、如何提问、如何输出」 -
Workflow:完成最终执行动作
5.3 底层:确定性执行(Workflow / RPA / 脚本)
这一层的唯一要求:
不要信模型,要信代码和流程编排。
包括:
-
API 调用链 -
BPM 流程 -
RPA 机器人 -
定时任务 -
数据库操作事务
这里非常适合做成「Skill + MCP + Workflow」的组合:
-
Workflow 把一串 API / RPC / 脚本串起来 -
MCP 把外部系统包装成标准工具 -
Skill 负责: -
输入规范 -
输出规范 -
错误处理策略 -
不同状态码的解释
-
最后返回给 Agent 的应该是:
-
清晰的状态(成功 / 失败 / 部分成功) -
明确的字段(JSON 等结构化结果) -
标准错误码和错误信息
5.4 最后一层:结果转述(Agent)
Agent 的工作只是:
-
把结构化结果翻译成人能看懂的话 -
必要时附上详细解释和后续建议 -
避免「编故事」,严格按返回字段说话
在这一步也可以挂一个简单 Skill:
-
统一输出口吻 -
统一敏感信息处理方式 -
统一错误提示文案
6. Skill 在行业 Workflow 里的落地方式
回到文章标题里的核心问题:行业 Workflow 如何通过 Skill 落地?
可以拆成三步。
6.1 把「人做事的方式」变成 Skill
先不碰系统,先去梳理:
-
关键流程当前是怎么执行的? -
有哪些「资深同事会说:新人容易犯错的点」? -
有没有文档 / 模板 / 复盘材料?
然后做的事情是:
-
挑出重复度高、流程相对固定的一批任务。 -
每个任务建一个 Skill 文件夹,写 SKILL.md:-
场景描述:什么时候应该用这个 Skill? -
输入要求:有哪些字段,格式是什么? -
处理步骤:拆成 1、2、3… -
输出规范:JSON 字段 + 人类可读的模板 -
示例:2~3 个高频真实例子
-
第一轮不用追求覆盖所有流程,重点是把写 Skill 这件事本身跑顺。
6.2 把「系统做事的方式」变成 Workflow + MCP
接下来梳理现有系统资产:
-
哪些已有 API / 脚本 / RPA 可以直接复用? -
哪些流程现在是人工填表 + 审批 + 抄数? -
哪些操作有合规 / 风控要求,必须严格走系统?
然后做:
-
把可复用的系统能力包装成 MCP / 内部 API。 -
用我们熟悉的方式编排成 Workflow(BPM / 编排平台 / 自写 Orchestrator)。 -
明确每个 Workflow 的: -
输入结构 -
输出结构 -
错误码定义 -
审计日志
-
这一步的原则是:
尽量少改存量系统,尽量通过「外面包一层」的方式让它变成可调用的 Workflow 组件。
6.3 用 Skill 把「人」和「系统」连起来
最后一步,把 Skill 作为桥梁:
-
上游:Agent 与用户对话 -
中游:Skill 指导 Agent 该怎么理解、怎么提问、怎么路由 -
下游:Workflow/MCP 真正执行动作
一个典型链路会变成:
-
用户输入需求 -
Agent 用「意图 Skill」判断任务类型 -
分发给对应领域 Agent -
领域 Agent 读取对应 Skill: -
补齐参数 -
调用 RAG 查规则 -
决定调用哪个 Workflow
-
-
Workflow 执行,通过 MCP / API 触达系统 -
返回结果由领域 Agent 按「输出 Skill」转成年类可读结果 -
Agent 统一封装成对用户的话术
所有「经验」、「SOP」、「注意事项」,尽量沉淀在 Skill 里:
-
方便以后版本升级 -
方便新业务线复用 -
方便做变更审计(Skill 本身可以版本控制)
7. 实施过程中的几个注意点
7.1 先把 Skill 写“够细”,再考虑自动化程度
很多团队上来就想着「全自动」,结果 Agent 兜不住,Workflow 无法覆盖异常,最后完全不敢放生产。
相对稳妥的节奏是:
-
用 Skill 把流程写细写透,先跑一段时间「人机协同」: -
Agent 给出建议 -
人来点确认 / 修改
-
-
统计哪些环节几乎没有人工干预 -
把这些环节下沉成 Workflow,逐步提高自动化比例
这样做有一个副作用:整个流程的「隐性知识」会被 Skill 强制写出来,对组织本身也是一种梳理。
7.2 旧系统是企业的「来时路」
很多看起来陈旧的:
-
定时脚本 -
报文接口 -
Excel 宏
从「Workflow + Agent」的角度看都是资产。
Skill 负责解释「什么时候、为什么、怎么用它」,MCP / Workflow 负责「怎么安全调用它」。
相比完全重构,一个实用的策略是:
给旧系统加一个 AI 适配层,而不是要求旧系统「变成 AI 原生」。
7.3 结构化数据回流
Agent 与用户的对话里,有大量可以反哺业务的信息:
-
用户真实需求 -
高频异常 -
流程里的瓶颈点 -
新出现的边缘场景
建议在设计时就准备好:
-
把关键字段结构化写入日志 / 数据库 -
定期用这些数据更新: -
Skill 内容 -
RAG 知识库 -
流程设计(Workflow)
-
不要只留下聊天记录,要留下可分析的行为数据。
8. 小结
把前面的内容合在一起,其实可以简化为三条:
-
Skill 把「怎么做事」固化下来 -
它是 Agent 的“操作手册” -
它让流程可以被描述、复用、版本化
-
-
Workflow 把「谁来做、何时做、按什么顺序做」编排起来 -
它对接真实系统和资源 -
它保证执行的确定性和审计能力
-
-
Agent 把「人类模糊的需求」翻译成「可以被 Skill + Workflow 执行的指令」 -
它是交互层和调度层 -
它不是行业壁垒本身
-
在这个结构下,“降本增效”不再是一个抽象口号,而是一个比较直观的路径:
-
过去那些无法自动化的非结构化需求(邮件、沟通、模糊指令), -
通过 Agent + Skill 变成可结构化的任务描述, -
再通过 Workflow + MCP 交给稳定的代码和系统去执行。
从研发团队视角看,这套东西真正改变的是工作方式:
-
从「写提示」变成「设计并维护一套可执行流程」; -
从「做一次性 Demo」变成「搭一套能长期演进的智能基础设施」。
如果你正在做行业 Agent,或者准备在内部推一个 AI 助手,可以先从一件事开始:
挑一个你们团队最常做、步骤最清晰、但最浪费时间的任务,把它完整写成一个 Skill,再把现有系统封装成一个 Workflow。
这两个拼起来,基本就是你们自己的第一个「行业 Workflow + Agent」原型。
以上。