AI 智能体开始进入真实工作流：下一场竞争不只是模型更强

数据线索来自 AI HOT；事实核验以 Anthropic、xAI、Google、Adobe 等官方或一手来源为准。

一句话结论

过去一年，行业最常见的讨论还是“哪个模型更强”。但 2026 年 6 月这一轮密集更新说明，真正开始拉开差距的，已经不是模型答题分数，而是谁能把智能体嵌进真实工作流，并让团队真的愿意长期使用。

换句话说，AI 智能体正在从“看起来很厉害的演示”变成“组织里真的有人依赖它干活的产品”。

最近几天，几家公司其实在回答同一个问题

表面上看，这几条新闻来自完全不同的赛道：

Anthropic 为 Claude Code 增加 artifacts，把会话结果直接变成可共享、可更新的网页。
Anthropic 又系统解释了 CLAUDE.md、skills、hooks、rules、subagents 等自定义机制。
xAI 把 Grok 接进 Databricks Agent Bricks，让企业可以在统一治理环境里调用它。
Google 回顾 A2A 协议一周年，强调多智能体之间的标准化协作。
Adobe 把 AI Assistant 推进 Photoshop、Premiere 等创意软件，不再只做单点生成。
火山引擎上线豆包实时语音模型 3.0 API，强调多人实时对话、工具调用和更稳的交互判断。

如果把这些放在一起看，它们都在回答一个问题：

当 AI 不再只是一个“回答问题的模型”，而是一个要进入真实组织、真实软件、真实流程的执行者时，产品到底该怎么设计？

这才是最近这波更新真正重要的地方。

第一阶段已经结束了：大家都知道模型会做事

过去一段时间，行业对 AI 智能体的想象基本集中在三件事上：

它能不能自己写代码
它能不能自己用工具
它能不能在少量人工监督下多跑几步

这个阶段的核心是“证明能力存在”。

现在的问题变了。企业和团队不再只问“它能不能做”，而是开始问：

它做完之后，其他人怎么看结果？
它接进现有系统后，权限和治理怎么办？
它的工作成果，能不能被纳入团队的日常协作？
它是一次性的炫技，还是能每天稳定运行的产品？

也就是说，行业已经从“能力验证”进入“工作流验证”。

Claude Code artifacts：智能体第一次把“过程”也产品化了

Claude Code artifacts 很值得单独看，因为它解决的不是“让智能体多做一件事”，而是“让智能体做事的过程更容易被人类组织接受”。

Anthropic 的设计思路很清楚：Claude Code 不只是生成一个答案，而是把整段工作会话沉淀成一个可共享网页，里面可以包含 PR 讲解、发布清单、错误率图表、时间线、调查过程和当前结论，而且页面会随着会话推进持续刷新。

这件事表面上像是一个展示层功能，实际上很关键。

原因在于，真实团队里最大的摩擦之一从来不是“模型没做事”，而是“模型做了事，但别人看不懂，也接不住”。
如果智能体每次干完活都还要人类再手工汇报一次，它就只是一个效率放大镜；只有当它能把结果直接整理成团队可消费的对象，它才开始接近真正的工作流产品。

Artifacts 的价值就在这里：它把智能体输出从“对话框里的答案”变成“组织里可以传递的工作产物”。

CLAUDE.md、skills、hooks：谁能把智能体接进组织，谁才真正有壁垒

Anthropic 另一篇文章解释了 Claude Code 的多层自定义机制。这个更新之所以重要，不在于又多了几个名词，而在于它把智能体配置从“大提示词堆叠”推进到了“组织级行为系统”。

传统做法是：大家把所有要求都塞进一个系统提示词或者一个仓库说明文件里。
这样做短期可行，但一旦团队变大、项目变多、任务类型变复杂，就会变得极难维护。

Anthropic 现在做的是分层：

用 CLAUDE.md 管项目级长期上下文
用 rules 限定作用域
用 skills 按需引入能力
用 subagents 隔离任务
用 hooks 把确定性流程自动化

这说明头部产品已经意识到，未来智能体产品的核心门槛之一，不是模型参数，而是能不能把组织规则、权限边界、工程流程和上下文结构化地装进系统里。

这类东西不如模型榜单显眼，却更接近长期壁垒。

Grok 接入 Databricks：企业不会围着单一模型建系统

xAI 把 Grok 集成进 Databricks Agent Bricks，释放的信号非常明确：
企业客户越来越不愿意围绕单一模型厂商重建整套流程，它们更倾向于在统一的企业数据和治理平台里“消费模型能力”。

这意味着什么？

意味着模型正在被平台化、组件化。

对企业来说，真正重要的是：

数据是不是还留在自己的治理框架里
权限控制是不是统一
审计、监控和选择模型是不是在同一个面板里完成
模型换一家后，工作流能不能继续跑

这会让竞争重心进一步转移。

未来前沿模型当然还重要，但它们很可能更像是平台中的高价值零件，而不是唯一主角。谁能把模型放进企业可接受的系统里，谁更可能拿到长期预算。

A2A 一周年：智能体的下一个问题不是更聪明，而是彼此怎么协作

Google 对 A2A 的回顾也很有代表性。它强调的不是“单智能体更强”，而是为什么要有一个专门面向生成式 AI 的智能体协作协议。

这背后的逻辑很简单：

单个智能体能做的事越来越多，但真实业务流程通常并不适合交给一个万能代理包打天下。
更常见的情况是：

一个代理擅长检索与汇总
一个代理擅长编码与执行
一个代理擅长审批与路由
一个代理代表具体应用或具体部门

一旦进入这个阶段，系统问题就从“模型能否完成任务”转向“多个代理如何安全分工、传递状态、隔离上下文并交接责任”。

A2A 这种协议的价值，不是让智能体看起来更前沿，而是给未来的大规模协作留出基础设施标准。

换句话说，行业已经开始默认：多智能体协作不是可选项，而是未来真实系统的常态。

Adobe 与豆包语音 3.0：真正的产品化，一定发生在原生场景里

如果说 Claude Code 和 Databricks 更偏工程与企业，那么 Adobe 和豆包实时语音模型 3.0 说明同一逻辑也正在向更广泛的软件产品扩散。

Adobe 做的不是再推出一个独立“AI 生成工具”，而是把智能体塞进 Photoshop、Premiere、Illustrator 和 InDesign 这些已有工作软件中，让它直接承担分拣素材、粗剪、改版式、换背景这类具体步骤。

这很重要，因为它体现了一个成熟产品判断：

用户通常不想“去使用一个 AI 产品”，用户想要的是“原来的工作软件突然更会干活了”。

豆包实时语音 3.0 也类似。它强调多人对话下的安静待命、动态判停、工具调用和更低误打断率，本质上不是在卷一个更漂亮的语音模型分数，而是在卷“真实交互里到底烦不烦人、靠不靠谱、能不能接进场景”。

这类能力看起来没有“模型参数翻倍”那么抓眼球，但它们决定了产品能不能真正进入车载、客服、硬件和协作软件这些高频场景。

我的判断：下一阶段的竞争，会从模型竞争变成工作流竞争

如果把这几条新闻连起来，一个相对清晰的趋势已经出现：

1. 模型能力仍重要，但不再足以形成完整产品优势

模型当然还是底座，但“模型更强”正在越来越快地被追平。真正难复制的是：

上下文如何组织
结果如何共享
权限如何治理
多代理如何协作
软件原生场景如何嵌入

2. 真实组织只会采购能进入流程的智能体

企业不会为一个“看起来很聪明”的演示长期买单。
它们只会为真正能嵌进数据、协作、审批、记录、交接和审计流程的系统买单。

这就是为什么 artifacts、Agent Bricks、A2A、软件内嵌代理这些动作值得被放在同一张图里看。

3. “人机协作界面”会比“模型本身”更稀缺

未来最值钱的部分，可能既不是单个模型，也不是某个孤立工具，而是人和多个智能体协同工作的界面与流程设计。
谁能把这层做顺，谁就更有机会占住真正高频、长期的入口。

对团队意味着什么

如果你是做产品、工程或企业应用的人，现在最该关注的不是“下一个榜单第一是谁”，而是三个更实际的问题：

你的工作流里，哪些环节已经适合交给智能体持续执行？
这些智能体的结果，别人能否直接复用和审阅？
你有没有为权限、上下文、审批和交接设计结构，而不是临时靠人盯着？

真正的分界线很快会出现：

还停留在“聊天框调用模型”的团队，会把 AI 当成增强工具
能把智能体塞进真实流程并让组织持续运转的团队，会把 AI 当成新的执行层

这两者的效率差距，未来只会越来越大。

最后

AI 智能体最早打动人的地方，是它看起来像一个会思考、会调用工具、会自己往下做的数字员工。

但决定它能不能真正进入现实世界的，从来不是“它像不像人”，而是：

它能不能变成流程的一部分、组织的一部分、软件的一部分。

2026 年 6 月这一轮更新说明，这一步已经开始了。下一场竞争，不只是模型更强，而是谁能把智能体做成真正可落地的工作流产品。

主要来源

深度分析 · 作者：钟懿 · 2026 年 6 月 21 日

一句话结论#

最近几天，几家公司其实在回答同一个问题#

第一阶段已经结束了：大家都知道模型会做事#

Claude Code artifacts：智能体第一次把“过程”也产品化了#

CLAUDE.md、skills、hooks：谁能把智能体接进组织，谁才真正有壁垒#

Grok 接入 Databricks：企业不会围着单一模型建系统#

A2A 一周年：智能体的下一个问题不是更聪明，而是彼此怎么协作#

Adobe 与豆包语音 3.0：真正的产品化，一定发生在原生场景里#

我的判断：下一阶段的竞争，会从模型竞争变成工作流竞争#

1. 模型能力仍重要，但不再足以形成完整产品优势#

2. 真实组织只会采购能进入流程的智能体#

3. “人机协作界面”会比“模型本身”更稀缺#

对团队意味着什么#

最后#

主要来源#