<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>潘锦的空间 &#187; 工作流</title>
	<atom:link href="https://www.phppan.com/tag/%e5%b7%a5%e4%bd%9c%e6%b5%81/feed/" rel="self" type="application/rss+xml" />
	<link>https://www.phppan.com</link>
	<description>SaaS SaaS架构 团队管理 技术管理 技术架构 PHP 内核 扩展 项目管理</description>
	<lastBuildDate>Sun, 10 May 2026 02:26:45 +0000</lastBuildDate>
	<language>zh-CN</language>
		<sy:updatePeriod>hourly</sy:updatePeriod>
		<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=3.9.40</generator>
	<item>
		<title>关于 AI Agent 的思考：大模型边界和工作流</title>
		<link>https://www.phppan.com/2025/11/ai-agent-workflow/</link>
		<comments>https://www.phppan.com/2025/11/ai-agent-workflow/#comments</comments>
		<pubDate>Sun, 09 Nov 2025 11:19:57 +0000</pubDate>
		<dc:creator><![CDATA[admin]]></dc:creator>
				<category><![CDATA[架构和远方]]></category>
		<category><![CDATA[AIAgent]]></category>
		<category><![CDATA[AIAgent架构]]></category>
		<category><![CDATA[工作流]]></category>

		<guid isPermaLink="false">https://www.phppan.com/?p=2431</guid>
		<description><![CDATA[最近在体验一些 AI Agent 的产品，有一个比较感受：大多数的 AI Agent 最终都是一个或多个工作流 [&#8230;]]]></description>
				<content:encoded><![CDATA[<p style="color: #191b1f;" data-first-child="" data-pid="B_wHWudk">最近在体验一些 AI Agent 的产品，有一个比较感受：大多数的 AI Agent 最终都是一个或多个工作流，原本我们想象的那种完全自主、能够独立思考和决策的 AI Agent 很少。</p>
<p style="color: #191b1f;" data-pid="dOuLvQzW">从而也就无法看到一句话就完成所有的事情，需要有专业的人在旁边盯着。</p>
<p style="color: #191b1f;" data-pid="dJK2zHiL">甚至出现了一个新的名词：大模型善后工程师</p>
<p style="color: #191b1f;" data-pid="lmNDcnh8">并且那种自动多的 AI Agent ，面对的大多数是对于幻觉，有一定容错的场景，如自动化报告生成，陪伴语聊。</p>
<p style="color: #191b1f;" data-pid="tcK64UfN">那些无法容错的场景， AI Agent 就必须要人工审核或者带审计的工作流来完成。</p>
<p style="color: #191b1f;" data-pid="nkac56gb">为什么在准确性要求比较高的 AI Agent 都变成了工作流？</p>
<p style="color: #191b1f;" data-pid="q-kTIqET">看一下我们常见的 AI Agent 逻辑：</p>
<p style="color: #191b1f;" data-pid="nXPEnix4">收到用户输入 → 判断意图 → 调用对应的模块 → 整理输出 → 返回结果</p>
<p style="color: #191b1f;" data-pid="nIXhBcAN">这跟我们想象中的 Agent 差距很大。理想中的 Agent 应该像一个真正的助手，能理解复杂的需求，自主规划执行路径，遇到问题能灵活调整策略。但现实是，大部分产品都在用固定的流程来约束 AI 的行为。</p>
<p style="color: #191b1f;" data-pid="M-DVJqWK">为什么会这样？核心原因是大模型本身的特性决定的。</p>
<h2 style="font-weight: 500; color: #191b1f;">大模型的能力边界在哪里</h2>
<p style="color: #191b1f;" data-pid="7F09Y1Q4">大模型确实很强大，但它有明确的能力边界。</p>
<p style="color: #191b1f;" data-pid="VwUqGvic">第一个边界是可靠性。大模型的输出本质上是概率分布，每次生成都有不确定性。同样的输入，可能得到不同的输出。这种不确定性在聊天场景下可以接受，但在准确率要求比较高的生产环境中就是个大问题。比如一个财务报表分析的 Agent，我们是无法接受它今天说利润率是 15%，明天又说是 18%。</p>
<p style="color: #191b1f;" data-pid="s5FRdeHH">第二个边界是准确性。大模型的训练数据是有截止时间的，而且它没有实时获取信息的能力。更重要的是，它会产生幻觉——看起来很有道理，但实际上是错的。一个合同审核的 AI Agent，引用了一条根本不存在的法律条款，差点出事。</p>
<p style="color: #191b1f;" data-pid="4FR_TeoD">第三个边界是执行能力。大模型本质上是一个文本生成器，它不能直接操作系统、调用 API、访问数据库。所有这些能力都需要额外的工程实现。而一旦涉及到外部系统的调用，就必须有明确的权限控制和错误处理，这又把我们拉回到工作流的思路上。</p>
<p style="color: #191b1f;" data-pid="IF_6Go5B">第四个边界是成本。完全放开让大模型自主决策，意味着大量的 token 消耗。一个复杂任务可能需要多次推理、多次调用，成本会急剧上升。在我们做 AI Agent 之初，成本问题就是一个要着重考虑的问题。我最近用得比较多的编程 Agent，就因为成本问题，把之前的收费逻辑做了颠覆式的变化，作为一个用户，最直观的感受就是费用暴增。</p>
<h2 style="font-weight: 500; color: #191b1f;">使用工作流是一种现实</h2>
<p style="color: #191b1f;" data-pid="FM3YOQOK">面对这些边界，工作流成了一个自然的选择。</p>
<p style="color: #191b1f;" data-pid="d_dFaoRt">工作流解决了可控性问题。通过预设的流程，我们能确保 AI 的行为在可控范围内。每一步该做什么、不该做什么，都有明确的定义。这对企业应用来说至关重要。没有哪个企业敢把关键业务交给一个完全不可控的系统。</p>
<p style="color: #191b1f;" data-pid="XAQVD5ls">工作流解决了准确性问题。在工作流的每个节点，我们可以加入验证和校准机制。比如在数据查询环节，直接调用数据库而不是让大模型猜测；在关键决策点，加入人工审核环节。这样既利用了大模型的能力，又避免了它的短板。</p>
<p style="color: #191b1f;" data-pid="SjY4R189">工作流还解决了成本问题。通过流程优化，我们可以精确控制大模型的调用次数和方式。简单的任务用小模型或规则引擎处理，复杂的任务才调用大模型。这种分层处理大大降低了运营成本。</p>
<p style="color: #191b1f;" data-pid="lSAdpfJD">更重要的是，工作流让产品可以迭代优化。每个环节的表现都可以监控和改进，哪里出问题就改哪里，而不是面对一个黑盒束手无策。</p>
<h2 style="font-weight: 500; color: #191b1f;">如何设计一个好的工作流 Agent</h2>
<p style="color: #191b1f;" data-pid="h0-W-pH-">既然工作流是当前的现实，那怎么设计一个好的工作流 Agent？</p>
<ol style="color: #191b1f;">
<li data-pid="disuGVzL">任务拆解。把复杂的任务拆解成多个简单、明确的子任务。每个子任务都有清晰的输入输出定义。比如一个智能客服 Agent，可以拆解为：意图识别、信息提取、知识检索、答案生成、对话管理等模块。</li>
<li data-pid="_keGzCJB">模块化设计。每个模块独立开发和优化，通过标准接口连接。这样的好处是可以灵活替换和升级。今天用规则引擎的地方，明天可以换成机器学习模型；现在用 GPT-4 的地方，以后可以换成更合适的专用模型。</li>
<li data-pid="KttqxEIM">状态管理。工作流需要维护整个对话或任务的上下文状态。这不仅包括用户的历史输入，还包括中间结果、系统状态等。良好的状态管理是实现复杂交互的基础。</li>
<li data-pid="tRZWM4V4">异常处理。每个环节都可能出错，需要有完善的异常处理机制。比如大模型返回了不合预期的结果怎么办？外部 API 调用失败怎么办？这些都需要提前考虑。</li>
<li data-pid="tcw8HkfP">人机协同。在关键环节保留人工介入的接口。这不是技术不行，而是业务需要。很多场景下，人工审核是合规要求，也是质量保证。总得有人背锅不是，毕竟 AI 背不了锅。</li>
</ol>
<h2 style="font-weight: 500; color: #191b1f;">工作流的局限性</h2>
<p style="color: #191b1f;" data-pid="QWrAqAxu">工作流虽然解决了很多问题，但也有明显的局限性。</p>
<p style="color: #191b1f;" data-pid="Kn7LW8zU">第一是灵活性不足。预设的流程很难应对所有情况，遇到流程外的需求就无能为力。这也是为什么很多 Agent 给人感觉很&#8221;笨&#8221;的原因——它只会按照固定的套路来。</p>
<p style="color: #191b1f;" data-pid="OprosMDF">第二是开发成本高。设计一个完善的工作流需要深入理解业务逻辑，每个流程都需要大量的开发和测试。而且业务变化时，工作流也需要相应调整，维护成本不低。</p>
<p style="color: #191b1f;" data-pid="mn8k6Udk">第三是用户体验的割裂感。用户能明显感觉到自己在跟一个程序打交道，而不是一个智能助手。特别是当工作流设计不够自然时，这种割裂感会更强。</p>
<h2 style="font-weight: 500; color: #191b1f;">预想可能的发展</h2>
<p style="color: #191b1f;" data-pid="RNGjb1ov">尽管当前工作流是主流，但技术还在快速发展。</p>
<p style="color: #191b1f;" data-pid="Zc4ON96q">模型能力在提升。新一代的大模型在准确性、稳定性上都有改进。特别是针对特定领域的专用模型，表现越来越好。比最新上的 Qwen3-Max 就针对工作流，工具调用有了特别的优化。这为减少工作流的约束提供了可能。</p>
<p style="color: #191b1f;" data-pid="NJc65Iec">工具调用能力在增强。Function Calling、Tool Use、MCP，以及最新的 SKILLS 等技术让大模型能更好地与外部系统交互。虽然本质上还是工作流，但流程可以更动态、更智能。</p>
<p style="color: #191b1f;" data-pid="B3BX6g4e">多模态融合带来新可能。不只是文本，图像、语音、视频等多模态信息的处理能力都在提升。这让 Agent 能处理更复杂的任务，提供更自然的交互。</p>
<p style="color: #191b1f;" data-pid="WcZuG6V8">强化学习和自主学习是长期方向。让 Agent 从交互中学习，不断改进自己的策略。虽然现在还不成熟，但这是实现真正自主 Agent 的关键。</p>
<h2 style="font-weight: 500; color: #191b1f;">产品化的思考</h2>
<p style="color: #191b1f;" data-pid="gSUisBhH">做 AI Agent 产品，技术只是一部分，更重要的是产品思维。</p>
<p style="color: #191b1f;" data-pid="hgNPtRG5">首先要明确定位。你的 Agent 是要解决什么问题？为谁解决？解决到什么程度？不要试图做一个万能的 Agent，那样最后什么都做不好。现在很火的小鹏的机器人，其有 80 个控制点，相对于宇树的 20 个控制点，其灵活性肯定要高一些，但是其场景和定位是完全不一样的，成本也不一样。</p>
<p style="color: #191b1f;" data-pid="NnpTV3MO">其次是场景选择。选择那些容错率相对高、价值明确的场景。比如内容创作辅助就比财务决策更适合当前的技术水平。在合适的场景下，即使是工作流 Agent 也能创造很大价值。</p>
<p style="color: #191b1f;" data-pid="t5ezCVSL">然后是预期管理。不要过度承诺，要让用户清楚产品的能力边界。与其说这是一个智能助手，不如说这是一个智能工具。合理的预期能减少用户的失望，提高满意度。</p>
<p style="color: #191b1f;" data-pid="HnEu4Ouw">还要重视数据积累。每一次用户交互都是宝贵的数据。通过分析这些数据，我们能发现工作流的不足，找到优化的方向。数据驱动的迭代是产品成功的关键。</p>
<p style="color: #191b1f;" data-pid="nUb2YRHO">最后是成本控制。AI Agent 的运营成本不低，必须找到合理的商业模式。是订阅制还是按量付费？是 To B 还是 To C？这些都需要根据产品特性和市场情况来决定。</p>
<h2 style="font-weight: 500; color: #191b1f;">实践中的几个关键点</h2>
<p style="color: #191b1f;" data-pid="N09Pg-h-">基于这段时间的观察和实践，有几个点特别重要。</p>
<p style="color: #191b1f;" data-pid="bhx_8COi">第一，不要迷信技术。大模型很强大，但它不是银弹。很多问题用传统方法解决更高效、更可靠。关键是找到合适的技术组合。</p>
<p style="color: #191b1f;" data-pid="CRItTPRo">第二，重视工程实现。一个好的想法到一个可用的产品，中间有大量的工程工作。提示词优化、结果解析、错误重试、性能优化，这些看似琐碎的工作往往决定产品的成败。</p>
<p style="color: #191b1f;" data-pid="gbw3I2cB">第三，持续迭代。AI Agent 产品很难一步到位，需要不断根据用户反馈来改进。建立快速迭代的机制，小步快跑，逐步逼近理想状态。</p>
<p style="color: #191b1f;" data-pid="GAbC3x27">第四，关注安全和合规。AI 的不可控性带来了新的安全风险。数据隐私、内容安全、决策可解释性，这些都需要提前考虑。特别是在企业级应用中，合规往往是第一要求。</p>
<p style="color: #191b1f;" data-pid="MOjv2ryk">第五，建立评估体系。怎么衡量一个 Agent 的好坏？准确率、响应时间、用户满意度、成本效率，需要建立全面的评估指标。只有能量化，才能持续优化。</p>
<h2 style="font-weight: 500; color: #191b1f;">写在最后</h2>
<p style="color: #191b1f;" data-pid="3nOyP8O4">做 AI Agent 产品这段时间，最大的感受是理想与现实的差距。我们都希望做出科幻电影里那样的 AI，但现实的技术约束让我们不得不妥协。</p>
<p style="color: #191b1f;" data-pid="dOGbNKwR">但这未必是坏事。工作流让 AI 变得可控、可靠、可用。在当前的技术条件下，一个设计良好的工作流 Agent，往往比一个不受约束的&#8221;智能&#8221; Agent 更有价值。</p>
<p style="color: #191b1f;" data-pid="wiJdf4Le">关键是要认清现实，在约束中寻找创新的空间。大模型的边界是客观存在的，但边界之内仍然有广阔的天地。工作流不是终点，而是通向更智能的 Agent 的必经之路。</p>
<p style="color: #191b1f;" data-pid="-QnXn7Re">技术在进步，产品在迭代，市场在成熟。今天的工作流 Agent，可能就是明天自主 Agent 的雏形。重要的不是等待完美的技术，而是用现有的技术创造价值，在实践中推动进步。</p>
<p style="color: #191b1f;" data-pid="DCzX0WwN">这个领域还很年轻，充满了可能性。无论是技术突破还是产品创新，都有大量的机会。保持理性的乐观，脚踏实地地推进，相信我们能做出真正有用的 AI Agent 产品。</p>
<p style="color: #191b1f;" data-pid="d75LBQnU">毕竟，每一个伟大的产品，都是从不完美开始的。</p>
<p style="color: #191b1f;" data-pid="6dB9Tpfk">以上。</p>
]]></content:encoded>
			<wfw:commentRss>https://www.phppan.com/2025/11/ai-agent-workflow/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
