研报 · AI Agent

AI Agent 平台、企业自动化、Agent 操作系统与工作流重构

AI Agent 平台(赛道研究)
SECTOR · AI
导读

企业 Agent 的护城河不在模型,而在"权限感知的数据访问 + 业务系统入口 + 审批/审计/观测"。已落地的财务信号:Microsoft AI 年化收入超 370 亿、商业 cRPO 6270 亿;ServiceNow 2026 AI 合同 ACV 有望破 15 亿、Now Assist 大客户同比 +130%;Palantir Q1 2026 总收入 +85%、美国商业 +133%;Salesforce Agentforce 按会话 $2 + Flex Credits + $5/席位多档计费已商品化。Gartner 预计 40% Agent 项目会因 ROI 不清晰被取消,"Agent washing"现象明显。重点跟踪 Microsoft / Salesforce / ServiceNow / Palantir / Atlassian / HubSpot / Workday / Google Cloud。

速览通俗速览 · 先读这里

AI Agent 不是更聪明的聊天框,而是能调工具、看权限、留状态、动手干活的"软件劳动力"。评级 跟踪——方向确定,泡沫和兑现同时打开

矛盾在"发布功能"和"实际收钱"之间。一边是真金白银:微软 AI 业务年化已跑到 370 亿、商业 cRPO 6270 亿;ServiceNow 2026 年 AI 合同有望破 15 亿、大客户翻倍多;Palantir 一季度收入翻倍出头。另一边是冷水:Gartner 警告 2027 年前超四成 Agent 项目会因 ROI 不清被砍,Salesforce 自家基准里真实 CRM 成功率不到四成。

护城河不在模型,而在权限感知的数据、业务系统入口和审批观测——编排框架最易被开源吞掉。优先盯平台型受益者(微软/Salesforce/ServiceNow/Palantir);回避只发功能、没披露付费的"Agent washing"

完整正文

核心结论

  • AI Agent 不是“更聪明的聊天框”,而是“受策略约束、可调用工具、可访问权限、可保留状态、可执行动作的软件劳动单元”。 OpenAI 已把 Agents SDK 明确定位为由应用侧掌握编排、工具执行、状态与审批的运行时;Anthropic、Amazon Bedrock 也都把 Agent 定义为能够调用工具、访问知识库、执行 API/桌面动作并在循环中完成任务的系统,而不是一次性回答器。

  • Agent 与传统 Copilot、聊天机器人、RPA、工作流自动化的本质区别,在于“是否拥有目标驱动的多步执行闭环”。 聊天机器人主要是问答;Copilot 多数场景仍以“辅助生成/辅助检索”为主;RPA 强在规则明确、界面稳定的脚本执行;工作流自动化强在确定性流程;Agent 则把“规划—检索—调用工具—状态管理—审批—执行—复盘”串成一体,并在不确定环境中处理异常。Workday 甚至直接将 Agent 与 chatbot 对比,强调前者可以跨上下文理解、规划、在边界内采取行动并从经验中学习。

  • 企业真正愿意为 Agent 付费的,不是“回答得更像人”,而是“替企业完成原本需要人、SaaS 席位、RPA 机器人或外包团队完成的工作”。 这也是为什么最先商业化的落点集中在客服、ITSM、销售跟进、知识检索、软件开发、合同与财务处理等可量化 ROI 场景。HubSpot 把 Breeze Agents 放到客服、销售、研究与数据任务;Workday 的公开案例已经落到请假、工资单、合同审查与业务流程优化;Zoom 把 agentic 功能落到会后跟进、文档生成与任务执行。

  • 企业需要 Agent 平台,而不是只直接调用大模型 API,原因不在模型本身,而在权限、连接器、审批、工作流状态、可追踪性、成本控制与治理。 Google Gemini Enterprise强调 permissions-aware 企业搜索、SSO、用户级访问控制和跨 SaaS 连接器;ServiceNow 强调“带业务上下文与权限的 Autonomous Workforce”;Workday 强调 Agent System of Record;Atlassian 把 Rovo 绑定到 Teamwork Graph 与大量连接器;Microsoft Copilot Studio 则强调 instructions、knowledge、tools、triggers、嵌入与多渠道发布。

  • 长期利润池更可能留在“系统入口 + 工作流 + 权限 + 数据图谱 + 治理”层,而不是单纯模型层。 模型层资本强度高、竞品多、价格下行快;而企业级 Agent 真正难的是把模型接入 SaaS / ERP / CRM / ITSM / 文档库 / 身份系统并可审计地执行。Workday 的 Agent System of Record、Atlassian 的 Teamwork Graph、Google 的 permissions-aware enterprise search、Microsoft Graph 与 Entra、ServiceNow 的平台式 workflow data/AI control tower 定位,都说明企业价值正在从“system of record”向“system of action”迁移,但这个迁移仍然要建立在既有系统与权限之上。

  • 最清晰的直接财务受益者,目前是 Microsoft、Salesforce、ServiceNow、Palantir;Oracle 更偏 AI 基础设施与数据库/云合同受益。 Microsoft Q3 FY26 披露其 AI 业务年化收入运行率已超过 370 亿美元,商业 cRPO 达到 6270 亿美元;Salesforce 已将 Agentforce 商品化为按会话、按 Flex Credits、按用户混合收费,并在最新公开披露中提到 Agentforce 交易规模与 Data Cloud+AI ARR 已形成实质信号;ServiceNow 则公开表示 2026 年 AI 相关合同价值有望超过 15 亿美元,且 Now Assist 大客户同比增长逾 130%;Palantir Q1 2026 总收入同比增长 85%,其中美国商业收入同比增长 133%,AIP 是最核心的增长叙事。

  • Atlassian、HubSpot、Zoom 更像“Agent 增强型软件公司”,短期更多是防御和 ARPU 结构重构,而不是已经被验证的独立 Agent 收入引擎。 Atlassian 将 Rovo 纳入云订阅,另对 Rovo Dev 单独收取开发者订阅与超额 credits;HubSpot 让 Breeze 一部分免费、一部分嵌入套餐、部分 Agent 走 HubSpot Credits;Zoom 继续把 AI Companion 作为 Zoom Workplace 的默认增强,再通过 Custom AI Companion 附加收费。这样的策略有助于留存和防守,但短期会稀释“AI 新收入”的可见度。

  • 商业模式正在从纯席位制向“席位 + 消耗 + 结果”混合制迁移,而不是一步到位彻底抛弃席位制。 Microsoft 同时保留 $30/用户/月的 Microsoft 365 Copilot,并在 Copilot Chat 中引入按消息计费的代理消耗模式;Salesforce 既有 $2/会话,也有 Flex Credits、$5/用户/月;Atlassian Rovo Dev 是 $20/开发者/月外加 credits 超额计费;HubSpot 则开始把部分 Agent 功能放到 credits 中。结论是:面向员工生产力的 Agent 更接近席位制,面向流程执行与对外服务的 Agent 更接近 usage / outcome 制。

  • 最容易被高估、最容易泡沫化的赛道,是“编排框架 / Agent builder / memory wrapper / 通用多 Agent 中间件”。 这一层开源替代极强:AutoGen、Semantic Kernel、DSPy、CrewAI、LlamaIndex 都在强调开发框架、插件、可扩展、多 Agent 或模块化;LangChain 则更明确把商业化重心落在 LangSmith 的观测、评估、部署与运维,而不是单纯“搭 Agent”的框架本身。也就是说,框架能红,但不一定最会赚钱

  • 最强护城河层不是模型,也不是 prompt,而是“权限感知的数据访问 + 业务系统入口 + 审批/审计/观测”。 MCP 这样的开放标准会削弱封闭连接器溢价,但不会消灭企业级身份、权限、审计、成本监控和 HITL 的复杂性;恰恰相反,MCP 越开放,企业越需要一个能统一治理的控制面。

  • 企业 Agent 的现实边界仍然很硬,当前市场里“Agent washing”现象明显。 Gartner 预计到 2027 年,超过 40% 的 agentic AI 项目会因成本上升或商业价值不清晰而被取消,并预计到 2028 年 33% 的企业软件将包含 agentic AI、15% 的日常业务决策将由 agentic AI 自主做出;与此同时,MIT 的 2025 AI Agent Index 指出大部分 agent 开发者对安全、评测和社会影响透明度仍然有限。

  • 企业工作流比公开 demo 难得多,真正的瓶颈是隐藏状态、级联副作用和跨系统可靠执行。 ServiceNow 的 World of Workflows 基准显示,企业系统的隐含流程与不可见状态会使前沿模型出现“dynamics blindness”;Salesforce 的 SCUBA 基准则显示,零样本下开源模型驱动的 computer-use agents 在真实 CRM 工作流上的成功率不到 5%,闭源方法也仅能做到 39%,在加入示范后提升到 50% 左右;APEX-Agents 中,跨应用长链条知识工作任务的最佳 Pass@1 仍只有 24%。这意味着未来 12–24 个月的核心投资变量不是“谁先发了 Agent”,而是谁能把 Agent 从 demo 变成可靠的生产系统。

  • 从投资上看,最值得关注的不是“Agent 概念所有受益者”,而是三类公司: 一类是平台型直接受益者,已经能把 Agent 转化为新合同、新 usage、新 backlog 的公司;一类是治理/可观测/权限层受益者,因为生产化越深入,治理越刚需;一类是高工作流壁垒垂直 Agent 应用,尤其是客服、ITSM、代码、法律、财务与研究。相反,仅有 Agent 宣传、缺乏收入证据的公司,短期更可能只是防御性叙事。

产业链全景与架构

先讲结论:AI Agent 产业链不是“模型公司—应用公司”两层,而是“模型/工具能力—编排执行—连接器与权限—数据检索与记忆—治理与可观测—业务系统入口—垂直执行应用”七层堆叠。 企业价值最高的地方通常不在最底层,而在最靠近真实工作与可审计执行的地方。OpenAI、Anthropic、Amazon Bedrock 都已经把 agent loop、工具调用、MCP、guardrails、人类审批、状态管理做成标准能力;Google、Microsoft、ServiceNow、Workday、Atlassian 则在其企业平台里把这些能力继续接到了 SSO、数据源、用户权限和业务工作流之上。

产业链位置 细分环节 核心产品/能力 Agent 需求驱动 主要收入模式 竞争壁垒 利润率特征 代表公司 受益强度 投资弹性
基础模型 推理、工具调用、长上下文、多模态、computer use Tools、function calling、tool search、computer use、server tools 让 Agent 能规划、看屏幕、用工具、调用代码/搜索 token、API、托管工具、企业订阅 模型效果、延迟、成本、企业合规 毛利受算力与价格战压制 OpenAI、Anthropic、Mistral、Cohere、AWS Bedrock Agents
Agent API / SDK 状态、编排、护栏、审批、可观测 Agents SDK、AutoGen、Semantic Kernel、DSPy 降低构建 Agent 的工程复杂度 开源 + 托管服务 / 企业支持 开发者生态、部署体验 单卖 SDK 利润并不稳 OpenAI SDK、AutoGen、Semantic Kernel、DSPy
编排框架 多 Agent 路由、handoff、任务规划 LangChain/LangSmith、CrewAI、LlamaIndex、Mistral Agents 复杂任务必须拆解与可重放 OSS + 观测/部署平台 生态与运维能力强于框架本身 纯框架易被压价 LangChain、CrewAI、LlamaIndex、Mistral 中高
工具与连接层 MCP、函数调用、企业连接器、浏览器/桌面 Remote MCP、Connectors、Teams/HubSpot/Slack 等插件 Agent 要进入企业真实系统 usage、连接器套餐、平台抽成 连接器广度 + 权限映射 + 稳定性 高毛利但需持续维护 OpenAI MCP、MCP 协议、Atlassian Rovo、Google Gemini Enterprise
数据与记忆层 RAG、文档解析、权限感知检索、状态存储 enterprise search、knowledge base、document OCR Agent 可靠性依赖上下文质量 席位、查询量、存储、平台包 权限感知检索、企业数据接入 较高毛利 Google Gemini Enterprise、AWS KB、LlamaIndex 中高
治理与可观测 tracing、evals、policy、审计、human-in-the-loop LangSmith、guardrails、AI Control Tower、Digital Wallet 生产化后最刚需 企业订阅、usage、审计模块 合规、可追责、跨模型中立 高毛利 OpenAI guardrails、LangSmith、ServiceNow AI Control Tower、Salesforce Digital Wallet 很高
企业 Agent 平台 统一数据、权限、工作流、UI 与市场 Copilot Studio、Agentforce、Gemini Enterprise、Rovo、Workday ASOR 企业不买“单点 Agent”,买“可治理的 Agent 操作系统” 席位 + usage + credits + 附加模块 安装基数、系统入口、身份、流程资产 最优 Microsoft、Salesforce、Google、Atlassian、Workday、ServiceNow 很高 很高
企业工作流 Agent ITSM、客服、销售、HR、法务、财务 预置 agent + agent builder ROI 可量化、预算来源清晰 per seat / per case / per action / per conversation 域数据与业务流程知识 视场景而定 ServiceNow、HubSpot、Workday、Zoom、Salesforce 很高
垂直原生 Agent 代码、客服、法律、研究、医疗 coding agents、customer agents、legal agents 可替代人工或低端软件座席 usage、成果分成、席位/credits 领域工作流与反馈数据 可很高 目前多在未上市,收入披露不充分;应优先跟踪已接近工作执行闭环者 很高
被替代层 传统 RPA、单点客服插件、低端 SaaS 组件、BPO 脆弱脚本、座席外包、只读知识库 Agent 以更少人/更少席位完成更多任务 传统席位/人力小时 壁垒弱、预算易被抽走 利润承压 受冲击的是“没有流程与权限护城河的工具/服务层” 负向

一个典型企业 Agent 系统,今天大体由十四个关键部件构成:模型层、编排层、工具调用层、数据检索层、memory 层、权限层、身份认证层、工作流层、审批层、可观测性层、安全治理层、成本控制层、业务系统集成层、用户界面层。 从护城河角度看,最稳的不是模型层,而是权限层、业务系统集成层、工作流层和治理层;从最容易开源替代的角度看,最脆弱的是编排框架、prompt/agent wrapper、通用 memory abstraction;从最容易被云厂商/模型厂商内置的角度看,基础工具调用、Agent builder、简单 RAG 与基本 observability 最危险

如果一定要回答“哪一层最值得给高估值”,我的答案是:不是最底层的模型,也不是最表层的聊天 UI,而是“离真实工作责任最近”的那一层——权限感知的数据与业务操作平面。 因为真正能收钱、能续费、能形成客户壁垒的,不是“它会不会生成”,而是“它能不能代表企业去做事,并且出了问题能不能查、能不能拦、能不能纠偏”。ServiceNow、Workday、Google、Microsoft、Atlassian 的产品设计几乎都在朝着这个方向收敛。

商业模式与财务弹性

AI Agent 平台如何收费? 公开资料已经给出清晰答案:未来主流不会是单一计费,而是席位费、消耗费、结果费并存。Microsoft 一边保留 Microsoft 365 Copilot 的 $30/用户/月,一边把 Copilot Chat 的 Agent 扩展为按 message / Azure meter 的 pay-as-you-go;Salesforce 同时提供 $2/会话、$500/10 万 Flex Credits、$5/用户/月的 Agentforce User License;Atlassian 把 Rovo 基础能力并入其云订阅,再把 Rovo Dev 按 $20/开发者/月 + 超额 credits 出售;HubSpot 则将部分 Breeze 能力免费、部分内嵌进套餐、部分 Agent 以 HubSpot Credits 结算;Zoom 的 AI Companion 继续“默认捆绑”,再用 Custom AI Companion 做附加收费。

公司 公开定价信号 计费逻辑 对 ARPU / NRR 的含义 备注
Microsoft M365 Copilot 维持 $30/用户/月;Copilot Chat agent usage 走 pay-as-you-go,generative answers 与 Graph grounding 按消息计费 员工助手更适合 seat;流程执行更适合 usage 有望抬高 ARPU,但也可能让部分用户先用免费/低费层,再逐步转化 商业模式更像“seat to train habit, usage to monetize automation”
Salesforce Conversations $2/会话;Flex Credits $500/10万 credits;Agentforce User License $5/用户/月 对外客服型适合会话;跨用例平台适合 credits 最利于 RPO/RPO 可见度,因为能预采购 + 超额结算 是目前最清晰的企业 Agent usage 商业化样板之一
Atlassian Rovo 已并入付费云计划;Rovo Dev $20/开发者/月,含 2,000 credits,超额 $0.01/credit 基础 AI 防御性捆绑 + 开发 Agent 独立变现 有利于提升整体留存,但新增收入更偏 Rovo Dev 更像“平台防守 + 高价值场景抽税”
HubSpot Breeze 一部分免费;部分 Agent 使用 HubSpot Credits 从 seat 向 credits 过渡 有机会提高 ARPU,但市场担心席位被压缩 典型的“Agent 既增收又可能蚕食席位”案例
Zoom AI Companion 默认随 Zoom Workplace 提供;Custom AI Companion 附加 $12/月 捆绑作为留存工具,增量通过 add-on 更偏防御 证明“并非所有 Agent 都会单独收费”

按席位收费的优点是采购简单、预算确定、适合员工协作助手;缺点是当 Agent 替代人类操作后,客户会开始追问“为什么一个机器人还按人头收钱”。按任务/流程/结果收费的优点是 ROI 更容易对齐,适合客服、销售外呼、票据处理、合同审查、工单流转等场景;缺点是预算预测更难、客户一开始不愿意开“空白支票”。因此可以预见未来 2–3 年最常见的形态是:底座保留 seat,自动化执行层改用 credits / conversations / actions / usage。

Agent 会提高 SaaS ARPU,还是减少席位?答案是两者都会发生,但发生在不同公司与不同场景。 如果公司拥有强 system-of-record 与 workflow-control,Agent 往往会先提高 ARPU、带来 usage 增长,并强化客户粘性;如果公司只是围绕人工用户的单点工具,Agent 则会压缩席位、降低 seat expansion。HubSpot 就是公开市场最典型的“被投资者担心 AI 提效后人员变少、从而冲击 seat 模式”的案例;UiPath 则面临另一种压力——RPA 需要证明自己能升级为 agentic automation 编排层,否则会被平台型软件与模型工具层向下吞噬。

模型调用成本如何影响毛利率? 这会是未来 12–24 个月企业软件最大的利润率分化变量之一。Anthropic 官方文档已经明示 server-side tools 存在额外 usage-based pricing;Microsoft、Salesforce、Atlassian、HubSpot 的产品定价也都在向 credits/meter 迁移,本质上是把 token 与工具调用成本部分外显给客户。更关键的是,Salesforce 公开的 compound AI 系统部署研究显示,通过模块化推理架构、动态扩缩容和 MLOps,可以把 P95 延迟压低 50% 以上、吞吐提升至 3.9 倍、成本下降 30%–40%。结论很直接:未来 AI 软件毛利率的核心,不只是模型便宜,而是谁能把 agentic workload 做成可优化、可路由、可观测的系统。

情景 企业 Agent 采用率 独立付费率 推理成本变化 软件公司 ARPU 变化 席位数量变化 客户留存变化 利润率变化 受益环节 被冲击环节
保守 低到中;试点多、生产少 低;很多仍算 bundle 功能 成本下降有限 小幅提升 稳中微降 留存略增 毛利率承压 平台捆绑、治理、搜索增强 单点 seat 工具、脆弱 RPA
基准 中;客服/ITSM/代码/销售/HR 开始进入生产 中;seat+usage 混合 成本持续下降 中幅提升 重复性岗位席位下降 NRR/留存明显改善 平台型软件利润率改善 平台层、治理层、垂直执行 Agent BPO、客服坐席、低端开发外包
激进 高;Agent 成为主流软件交互层 高;大量改为用量/结果付费 成本快速下降 平台公司显著提价,弱平台公司 ARPU 下滑 大幅下降 强平台留存显著抬升,弱工具留存恶化 强者更强,弱者利润塌缩 system-of-action 平台、权限治理、连接器市场 传统 seat SaaS、单点客服/RPA/外包

以上三种情景的锚点,不是拍脑袋:一方面,Gartner 已公开预测到 2028 年 33% 的企业软件将包含 agentic AI、15% 的日常业务决策将由 agentic AI 自主做出;另一方面,它也明确警告 2027 年前超过 40% 的项目可能因 ROI 不清晰而被放弃。因此,最合理的判断不是“Agent 一定会很快吞噬软件”,而是商业化会先在高 ROI 的工作流落地,并通过 installed base 渗透而不是全面重构同时发生。

赛道与竞争格局

企业 Agent 平台是当前最值得重视的大赛道,因为它最贴近预算入口,也最容易把 Agent 直接变成可持续合同。这里的优胜逻辑不是“谁模型最好”,而是“谁最接近用户入口、企业数据、权限系统和执行工作流”。Microsoft 依赖 Microsoft 365、Graph、Entra 与 Copilot Studio;Salesforce 依赖 CRM、Data Cloud、Flow、Slack 和 Agentforce;ServiceNow 依赖其 workflow platform 与 AI Control Tower/Autonomous Workforce;Google 依赖企业搜索、连接器和权限感知问答;Workday 则试图用 Agent System of Record 抢占“数字员工管理”这一新的系统定义。

Agent 编排框架 / SDK是技术上最活跃、资本市场上最容易讲故事,但也最容易开源化和平台化的赛道。AutoGen、Semantic Kernel、DSPy、CrewAI、LlamaIndex、Mistral Agents、Cohere tool use 都在把“构建 Agent”门槛变低;LangChain 之所以商业价值更稳,是因为它已经把重点转向 LangSmith 的 tracing、evaluation、deployment、fleet。换句话说,“能搭”很快会不值钱,“能测、能管、能上线”才开始值钱。

连接器 / MCP / iPaaS 可能是未来利润池被低估的一层。因为 Agent 一旦从“回答”进入“执行”,它就必须接 CRM、ITSM、ERP、邮箱、日历、文档、浏览器、数据库与内部 API。MCP 已被描述为跨客户端与服务器的开放协议,ChatGPT、Claude、VS Code、Cursor 等都已支持;OpenAI 也把 remote MCP 直接列为工具类型。开放标准会削弱封闭平台的格式壁垒,但不会削弱企业对认证、审计、权限映射和连接稳定性的付费意愿。因此连接器会开源化,连接器运营与治理不会。

治理、安全与可观测性 是最像“下一代中间件”的赛道。它的价值不在 demo 阶段,而在“项目一旦要上线,公司法务、安全、审计、IT 就突然必须买”。OpenAI 的 guardrails 与 human review、Anthropic 的 strict tool use、Google 的 access controls 与 user-level access、ServiceNow 的 AI Control Tower、Salesforce 的 Digital Wallet 与使用监控,都在说明:Agent 一旦执行真实动作,治理从可选项变成商业必需品。 从投资逻辑看,这一层通常具备高毛利、高复购和高切换成本,只是短期市场规模不会像 frontline application 那么大。

最先落地的工作流 Agent,不是最酷的通用助理,而是最“无聊”的高频流程:IT 工单、客服工单、销售跟进、会议后续、文档研究、合同分析、费用与假勤查询、编码与 code review。原因不是技术偏好,而是这些场景能直接连接“减少人力”“缩短 cycle time”“提高吞吐”“提高首解率”等财务指标。Workday、HubSpot、Zoom、ServiceNow、Salesforce 的公开产品路线都证明了这一点。

对传统软件与服务业的冲击 会先发生在四类地方。第一类是座席密集、单点功能的 SaaS;第二类是依赖静态脚本和模板的传统 RPA;第三类是低端呼叫中心与 BPO;第四类是低端软件开发外包和简单报表/研究外包。企业最终会逐步把大量预算从“买一个人用的软件”迁移到“买一个能完成任务的系统”。但要注意,拥有 system of record、领域数据和流程控制权的老牌软件商,不一定被颠覆;它们更可能被迫从system of record 升级为 system of action。这也是为什么 ServiceNow、Workday、Microsoft、Salesforce、Atlassian 比纯粹的“AI 助手壳子”更值得重视。

从竞争格局看,我的排序是:Microsoft 与 ServiceNow 是“企业 Agent 控制平面”的最强候选,Salesforce 是“客户工作流与外部服务 Agent”的最强候选,Palantir 是“高价值复杂工作流与政府/工业系统 Agent”的高弹性候选,Google 与 Workday 是“搜索/知识与数字劳动力管理”的潜在强平台,Oracle 更偏基础设施和数据库/行业 SaaS 的配套受益者。 但若从“市场是否已充分反映预期”看,Palantir 最贵、Microsoft 最稳、Salesforce/ServiceNow 风险收益比更平衡、HubSpot/UiPath 的预期差更大。 这不是买卖建议,而是“确定性—弹性—估值”三轴下的相对判断。

标的分层与评分

下面的分层只针对当前公开资料中最有证据支持的公司;没有把所有区域公司都强行归类,是因为很多公司只发布了 Agent 功能,却没有披露 Agent 收入、ARR、usage、RPO 或客户转化证据。

类别 公司/类型 Agent 受益路径或冲击路径 证据强度
A 类:核心直接受益者 Microsoft 以 Copilot + Copilot Studio + Graph + Entra 把 Agent 嵌入办公与业务流程;AI 业务年化收入运行率已超过 370 亿美元,具备最强 installed base 变现能力。 很高
A 类:核心直接受益者 Salesforce Agentforce 已有清晰的 conversation / credits / seat 定价,且公开材料已出现数千到上万单的交易与 Data Cloud+AI ARR 信号,是平台层里最像“usage revenue engine”的公司。 很高
A 类:核心直接受益者 ServiceNow AI 已进入合同价值与大客户扩张的公司级披露,且平台天然拥有 workflow、审批、权限与工单入口。 很高
A 类:高弹性直接受益者 Palantir AIP 正在把公司从“数据平台”推进到“可执行的 operational AI”,Q1 2026 美国商业收入同比增长 133%,是最强成长弹性之一。 很高
B 类:受益明显但竞争/估值风险高 Oracle 直接受益于 AI 云合同与数据库/行业套件接入 Agent;RPO 爆发,但更偏 infra 与大型合同,不完全是应用层 Agent beta。
B 类:受益明显但收入拆分仍有限 Atlassian Rovo + Teamwork Graph + 跨工具连接器 + Rovo Dev 独立收费,平台位置优秀;但基础 Rovo 更偏 bundle,新增收入可见度仍在建立。 中高
B 类:受益明显但存在模式重构风险 HubSpot Breeze 已进入客服、销售、研究与数据工作流,并开始用 credits 计费;但 AI 提效可能反向压缩 seat expansion,市场已开始担忧。 中高
B 类:受益明显但竞争压力大 Workday 以 Agent System of Record 抢占“数字员工控制台”定义,若企业接受这一叙事,将具备独特平台价值;但公开财务归因尚不充分。
C 类:主要是防御工具 Zoom AI Companion 的 agentic 化有助于留存与套件整合,但当前更像防守型 bundle 与适度附加收费,而不是独立增长引擎。
C 类:双刃剑公司 UiPath 一方面拥有自动化与编排基础,适合作为“RPA 2.0”升级者;另一方面 AI 也在削弱传统 RPA 的独占价值,市场已明显担心其增长放缓。
D 类:叙事强但财务验证不足 大量未单独拆分 Agent 收入的软件公司 发布 Agent 功能容易,披露真实付费转化难;Gartner 已提示“agent washing”普遍存在。 低到中
E 类:可能被冲击 单点 seat SaaS、低端客服/报表插件、低端 BPO / 呼叫中心、脆弱脚本 RPA 预算可能被平台型 Agent、客服 Agent、编码 Agent 和 outcome-based 自动化吸走。 高风险

我建议的评分模型仍然沿用你给出的逻辑,但在这轮公开资料验证中更适合做定性+半定量打分:

  • Agent 收入直接暴露度:25%
  • 产品/数据/工作流壁垒:20%
  • 客户质量和收入确定性:15%
  • 平台生态与连接器能力:15%
  • 财务质量和利润率:10%
  • 估值合理性:10%
  • 未来催化剂:5%

基于目前证据,我的优先研究排序是:Microsoft、ServiceNow、Salesforce、Palantir、Oracle、Atlassian、HubSpot、Workday、UiPath、Zoom。 这里的排序并不意味着“最应该买”,而是意味着“最值得持续跟踪的 Agent 兑现路径最清楚”。如果只看估值与预期差,我会把 Microsoft/ServiceNow/Salesforce 放在“确定性更高、预期较可管理”的一侧,把 Palantir 放在“兑现最强但估值最热”的一侧,把 HubSpot/UiPath 放在“可能存在预期差,但也伴随模式冲击”的一侧。

对应的被 Agent 冲击风险反向评分,我会把风险最高的对象放在“没有 system of record、没有权限控制、按席位收费、功能可被 Agent 直接替代”的公司与服务商上;而拥有流程编排、身份系统、组织图谱、工单/CRM/ERP/协作入口的公司,即使短期受压,也更可能转型成功。

重点上市公司画像

Microsoft:最强点不只是模型分发,而是把 Agent 嵌到 Microsoft 365、Graph、Entra 和 Copilot Studio 里,把工作场景、权限和办公入口捏在一起。Q3 FY26 公司官方披露 AI 业务年化收入运行率超过 370 亿美元,商业 cRPO 达到 6270 亿美元;Copilot Studio 支持 instructions、triggers、knowledge、tools 和嵌入式部署,商业模式既保留 $30/席位,也引入按 message 计量的自动化 usage。最大优点是 installed base 和渠道,最大风险是估值对 AI 的反映已很充分、且免费/低费层可能压制付费转化速度。

Salesforce:这是当前最值得盯住的“企业 Agent usage 商业化样板”。Agentforce 已不是泛泛的发布会概念,而是把会话、action、credits、seat 组合成可结算的一整套模式;公开市场已经看到其累计交易数与 Data Cloud+AI ARR 走向实质规模。它的核心护城河不是模型,而是 CRM 数据、Flow、Slack、MuleSoft、Data Cloud、行业云和客服入口。风险在于:Agentforce 今年的增量仍被市场质疑能否足够快地拉动整体增速,而 Salesforce 自己也在大幅采购模型 token,推理成本与产品毛利需要持续验证。

ServiceNow:如果把 Agent 时代比作“软件从数据库走向执行系统”,ServiceNow 是最天然的受益者之一,因为它本来就是工单、审批、流程和跨部门工作流的大脑。AI Agents/Autonomous Workforce 明确强调角色、业务上下文和权限;公司 2026 年公开表示 AI 合同价值有望超过 15 亿美元,Q1 2026 Now Assist 年 ACV 超过 100 万美元的大客户同比增长逾 130%,RPO 也继续扩张。最大的优点是工作流护城河与企业级治理位置,最大的风险是市场担心 AI 最终会削弱部分传统 workflow seats 的必要性。

Palantir:AIP 是目前上市软件里最接近“Agent 真正在复杂真实系统里执行”的公司之一。Q1 2026 Palantir 总收入同比增长 85%,美国商业收入同比增长 133%,管理层把 AIP 描述为“every agent action is governed, attributed and auditable”的 no-slop zone,这个表述非常重要,因为它正好抓住了 Agent 商业化的核心——可靠执行而非炫技。它的护城河在高复杂度系统整合、前线工程团队和政府/工业场景;风险则是估值已经隐含了极高的持续高增长预期。

Oracle:如果只讨论“企业 Agent 平台”,Oracle 不是最性感的名字;但如果讨论“谁会因为企业 Agent 推理量、数据库接入、行业 SaaS 和 AI 云合同而显著增收”,Oracle 非常值得研究。Reuters 披露其 FY26 Q3 RPO 同比增长 325% 至 5530 亿美元,增长主要由大规模 AI 合同驱动;同时,Oracle 官方也持续强调 AI agents 与高质量企业数据、ERP/HCM 系统集成的价值。它的受益路径更偏“底层 infra + database + app suite”,而不是最前台的 Agent UX。

Atlassian:Rovo 的战略价值高于短期收入体量。它最关键的资产是 Teamwork Graph,把协作、项目、会议、文档、代码和目标上下文连起来,再通过广泛连接器与 MCP 把上下文扩展到外部工具;Rovo Dev 则是其最有机会独立收费并拉高 ARPU 的 Agent 产品。对投资来说,Atlassian 更像“平台型长期受益者”,而不是短期业绩爆发的纯 Agent 票。

HubSpot:Breeze 证明 HubSpot 不只是把 AI 做成一个写文案按钮,而是在尝试把客服、销售拓客、公司研究、数据问答变成可执行的 agent teammates,还引入 marketplace 和 credits。问题也恰恰在这里:HubSpot 的 seat-based 成长模型可能被 AI 提效反噬。市场已经开始用更高的怀疑眼光审视它,Barron’s 明确指出投资者担忧 AI 可能减少人类用户、从而削弱公司传统 seat 增长。它是典型的“Agent 增强型公司”,同时也是“Agent 对自身旧模式的冲击样本”。

Workday:Workday 在产品定义上可能是最超前的,它不只做 Agents,而是提出了 Agent System of Record,试图把员工与数字员工放在一个系统里管理,并给出 analytics、ROI 与技能级控制。若这一套被大型企业采纳,Workday 会从 HR/Finance system-of-record 进化为数字劳动力控制台。问题在于,目前公开财务披露里还缺少足够清晰的 Agent 独立收入证据,因此更适合列入重点跟踪名单,而不是直接归入已兑现。

Zoom:Zoom 的 AI Companion 路线说明,不是所有公司的最佳策略都是“新 SKU + 高价加购”。它把 agentic 功能嵌入会议、任务、文档与视频工作流,并继续以“默认增强”的方式稳住套件价值,再用 Custom AI Companion 做适度加价。这种模式对提升留存和抑制产品同质化有帮助,但短期更偏防御而非爆发。

UiPath:UiPath 是最典型的“双刃剑”。一方面,它拥有自动化、编排、机器人执行和流程资产,看上去理应成为 RPA 2.0 的受益者;另一方面,市场也最担心 LLM Agent 会把传统 RPA 的脚本型价值吃掉。Barron’s 对 FY2027 指引放缓的反应和市场对 AI 竞争的担忧,说明 UiPath 必须证明自己不只是“旧 RPA 加上点 GenAI”,而是真正成为 Agent orchestration / governance 平台。它值得跟踪,但风险显著高于 Microsoft / Salesforce / ServiceNow。

Google / Alphabet:Gemini Enterprise 的产品定义非常清晰——它不是单一助手,而是 intranet search、AI assistant 与 agentic platform 的合体,带 permissions-aware access、预置连接器、Agent Gallery、SSO 与用户级访问控制。问题在于,对 Alphabet 来说,Agent 的收益会被广告、云和搜索的巨大体量稀释,所以更适合被视为“战略重要但投资 beta 不纯”的标的。

Amazon:Amazon Bedrock Agents 把 prompt engineering、memory、monitoring、encryption、user permissions 与 API invocation 一体托管,产品方向非常对;但从股票映射看,这更像 AWS AI 基础设施和平台能力的一部分,而不是可独立估值的 Agent 业务。对投资者而言,AWS 受益清晰,Agent 业务归因不清。

候补观察名单:如果要继续扩展到更多上市软件公司,我会优先把 SAP、GitLab、Pegasystems、NICE、Five9、Datadog、CrowdStrike、Okta 放入下一轮跟踪名单;不是因为它们一定都会成为核心赢家,而是因为它们分别位于 ERP/开发/流程/客服/可观测性/安全/身份这些 Agent 时代的关键节点。但这一轮对这些公司的“Agent 收入落地”验证不足,因此不宜在本报告里给出过度确定的财务判断。

风险、误区与后续研究

最大误区是把 Agent 研究做成“谁发布了功能最多”。真正重要的只有三件事:第一,Agent 是否进入生产;第二,Agent 是否进入计费;第三,Agent 是否改变客户预算结构。 Gartner 已经公开提醒大量 agentic 项目可能被砍,MIT 的 Agent Index 也提示行业透明度低;而 ServiceNow WoW、Salesforce SCUBA、APEX-Agents 这些基准进一步说明,从公开 demo 到企业生产之间隔着巨大的可靠性鸿沟。

从风险拆解看,最关键的十八项风险里,有六项尤其值得投资者持续盯:落地低于预期、付费率低于预期、权限/数据泄漏、安全事故、推理成本压缩毛利、平台挤压独立软件空间。 公开平台文档已经把这些问题写进了产品结构:OpenAI 强调 human review 与 guardrails,Anthropic 给 strict tool use 和 sandbox computer use,Google 强调 access control 与 user-level access,Workday 强调 human oversight 与 analytics,ServiceNow 强调 AI Control Tower,Salesforce 用 Digital Wallet 去可视化 usage。市场正在给“能把风险工具化”的公司更高的质量溢价。

最终研究结论可以压缩成十句话。

第一,AI Agent 在产业链中的位置,不是“又一个 AI 应用”,而是把基础模型变成可执行软件劳动力的中间操作层

第二,最值得关注的五个细分赛道是:企业 Agent 平台、治理/权限/观测层、客服与 ITSM Agent、AI coding agents、连接器/MCP/iPaaS 层

第三,最值得深入研究的上市公司,优先是:Microsoft、Salesforce、ServiceNow、Palantir、Oracle、Atlassian、HubSpot、Workday、UiPath、Zoom。 其中前四家是“兑现证据最强”,中间三家是“平台位置极佳但仍需验证财务拆分”,后两家是“模式正在被重构,因此预期差更大”。

第四,最值得跟踪的未上市方向,不应再是“再做一个通用 Agent 壳子”,而应是AI coding、AI 客服、Agent 治理/观测、企业连接器/MCP、文档 intelligence / memory、垂直法律/医疗/金融 Agent。这一层的大量公司收入仍未充分公开,必须用客户名单、付费模式和使用深度去筛选,而不能靠 demo 热度。

第五,最容易被市场误解的点,是把 Agent 当成“模型升级”;更准确地说,Agent 是软件商业模式升级。收入归属会从 seat 向 seat+usage+outcome 迁移。

第六,未来 6–12 个月最值得跟踪的指标,不是 MAU,而是:Agent 单独收入、credits 消耗、conversation/action 数、RPO/cRPO、AI 大客户数、NRR、推理成本、自动处理率、人工转接率、安全事故数。 这些才决定 Agent 能否从产品发布走向利润兑现。

第七,Agent 增强型软件公司 是将 Agent 嵌入现有产品来提高留存、扩张与差异化的公司,例如 Atlassian、HubSpot、Zoom、Workday。

第八,平台型 Agent 公司 是真正掌握企业身份、权限、数据入口和工作流的公司,例如 Microsoft、Salesforce、ServiceNow、Google、Workday。

第九,Agent 原生挑战者 将主要出现在代码、客服、研究、法律和垂直专业流程中,它们会优先抢占预算而不是先抢座席。这个层次的上市映射还很少,一级市场机会明显多于二级市场。

第十,最可能被冲击的传统软件或服务公司,不是所有老软件公司,而是没有数据壁垒、没有权限壁垒、没有工作流壁垒、主要按席位收费的点状工具与低端外包服务。

开放问题与局限:本报告对北美公开披露最充分的公司覆盖最深;中国、欧洲、日本、韩国、印度的大量公司目前缺乏足够清晰的 Agent 收入拆分公开数据,因此更适合进入下一轮本地语言与本地资本市场口径的专项研究。另一个局限是,许多公司并未在公开资料中逐一披露 Agent 相关 ARR、NRR、RPO/cRPO、精确估值倍数与模型成本,因此对这些字段我刻意没有做超出公开证据的填充。

更窄的后续研究方向:如果只选择一个继续深挖,我建议优先研究 企业 Agent 治理与权限控制。原因是:这层最容易被低估、最不容易被开源完全替代、最能横跨各模型与各 Agent 平台,同时最直接承接企业上线前的真实预算。排在第二位的专项方向,是 AI 客服 Agent,因为它是最先看到真实计费和流程替代的前线应用。

AI Agent企业 Agent 平台AgentforceCopilot Studio工作流MCP权限治理outcome 计费