AI Agent 不是更聪明的聊天框,而是能调工具、看权限、留状态、动手干活的"软件劳动力"。评级 跟踪——方向确定,泡沫和兑现同时打开。
矛盾在"发布功能"和"实际收钱"之间。一边是真金白银:微软 AI 业务年化已跑到 370 亿、商业 cRPO 6270 亿;ServiceNow 2026 年 AI 合同有望破 15 亿、大客户翻倍多;Palantir 一季度收入翻倍出头。另一边是冷水:Gartner 警告 2027 年前超四成 Agent 项目会因 ROI 不清被砍,Salesforce 自家基准里真实 CRM 成功率不到四成。
护城河不在模型,而在权限感知的数据、业务系统入口和审批观测——编排框架最易被开源吞掉。优先盯平台型受益者(微软/Salesforce/ServiceNow/Palantir);回避只发功能、没披露付费的"Agent washing"。
核心结论
AI Agent 不是“更聪明的聊天框”,而是“受策略约束、可调用工具、可访问权限、可保留状态、可执行动作的软件劳动单元”。 OpenAI 已把 Agents SDK 明确定位为由应用侧掌握编排、工具执行、状态与审批的运行时;Anthropic、Amazon Bedrock 也都把 Agent 定义为能够调用工具、访问知识库、执行 API/桌面动作并在循环中完成任务的系统,而不是一次性回答器。
Agent 与传统 Copilot、聊天机器人、RPA、工作流自动化的本质区别,在于“是否拥有目标驱动的多步执行闭环”。 聊天机器人主要是问答;Copilot 多数场景仍以“辅助生成/辅助检索”为主;RPA 强在规则明确、界面稳定的脚本执行;工作流自动化强在确定性流程;Agent 则把“规划—检索—调用工具—状态管理—审批—执行—复盘”串成一体,并在不确定环境中处理异常。Workday 甚至直接将 Agent 与 chatbot 对比,强调前者可以跨上下文理解、规划、在边界内采取行动并从经验中学习。
企业真正愿意为 Agent 付费的,不是“回答得更像人”,而是“替企业完成原本需要人、SaaS 席位、RPA 机器人或外包团队完成的工作”。 这也是为什么最先商业化的落点集中在客服、ITSM、销售跟进、知识检索、软件开发、合同与财务处理等可量化 ROI 场景。HubSpot 把 Breeze Agents 放到客服、销售、研究与数据任务;Workday 的公开案例已经落到请假、工资单、合同审查与业务流程优化;Zoom 把 agentic 功能落到会后跟进、文档生成与任务执行。
企业需要 Agent 平台,而不是只直接调用大模型 API,原因不在模型本身,而在权限、连接器、审批、工作流状态、可追踪性、成本控制与治理。 Google Gemini Enterprise强调 permissions-aware 企业搜索、SSO、用户级访问控制和跨 SaaS 连接器;ServiceNow 强调“带业务上下文与权限的 Autonomous Workforce”;Workday 强调 Agent System of Record;Atlassian 把 Rovo 绑定到 Teamwork Graph 与大量连接器;Microsoft Copilot Studio 则强调 instructions、knowledge、tools、triggers、嵌入与多渠道发布。
长期利润池更可能留在“系统入口 + 工作流 + 权限 + 数据图谱 + 治理”层,而不是单纯模型层。 模型层资本强度高、竞品多、价格下行快;而企业级 Agent 真正难的是把模型接入 SaaS / ERP / CRM / ITSM / 文档库 / 身份系统并可审计地执行。Workday 的 Agent System of Record、Atlassian 的 Teamwork Graph、Google 的 permissions-aware enterprise search、Microsoft Graph 与 Entra、ServiceNow 的平台式 workflow data/AI control tower 定位,都说明企业价值正在从“system of record”向“system of action”迁移,但这个迁移仍然要建立在既有系统与权限之上。
最清晰的直接财务受益者,目前是 Microsoft、Salesforce、ServiceNow、Palantir;Oracle 更偏 AI 基础设施与数据库/云合同受益。 Microsoft Q3 FY26 披露其 AI 业务年化收入运行率已超过 370 亿美元,商业 cRPO 达到 6270 亿美元;Salesforce 已将 Agentforce 商品化为按会话、按 Flex Credits、按用户混合收费,并在最新公开披露中提到 Agentforce 交易规模与 Data Cloud+AI ARR 已形成实质信号;ServiceNow 则公开表示 2026 年 AI 相关合同价值有望超过 15 亿美元,且 Now Assist 大客户同比增长逾 130%;Palantir Q1 2026 总收入同比增长 85%,其中美国商业收入同比增长 133%,AIP 是最核心的增长叙事。
Atlassian、HubSpot、Zoom 更像“Agent 增强型软件公司”,短期更多是防御和 ARPU 结构重构,而不是已经被验证的独立 Agent 收入引擎。 Atlassian 将 Rovo 纳入云订阅,另对 Rovo Dev 单独收取开发者订阅与超额 credits;HubSpot 让 Breeze 一部分免费、一部分嵌入套餐、部分 Agent 走 HubSpot Credits;Zoom 继续把 AI Companion 作为 Zoom Workplace 的默认增强,再通过 Custom AI Companion 附加收费。这样的策略有助于留存和防守,但短期会稀释“AI 新收入”的可见度。
商业模式正在从纯席位制向“席位 + 消耗 + 结果”混合制迁移,而不是一步到位彻底抛弃席位制。 Microsoft 同时保留 $30/用户/月的 Microsoft 365 Copilot,并在 Copilot Chat 中引入按消息计费的代理消耗模式;Salesforce 既有 $2/会话,也有 Flex Credits、$5/用户/月;Atlassian Rovo Dev 是 $20/开发者/月外加 credits 超额计费;HubSpot 则开始把部分 Agent 功能放到 credits 中。结论是:面向员工生产力的 Agent 更接近席位制,面向流程执行与对外服务的 Agent 更接近 usage / outcome 制。
最容易被高估、最容易泡沫化的赛道,是“编排框架 / Agent builder / memory wrapper / 通用多 Agent 中间件”。 这一层开源替代极强:AutoGen、Semantic Kernel、DSPy、CrewAI、LlamaIndex 都在强调开发框架、插件、可扩展、多 Agent 或模块化;LangChain 则更明确把商业化重心落在 LangSmith 的观测、评估、部署与运维,而不是单纯“搭 Agent”的框架本身。也就是说,框架能红,但不一定最会赚钱。
最强护城河层不是模型,也不是 prompt,而是“权限感知的数据访问 + 业务系统入口 + 审批/审计/观测”。 MCP 这样的开放标准会削弱封闭连接器溢价,但不会消灭企业级身份、权限、审计、成本监控和 HITL 的复杂性;恰恰相反,MCP 越开放,企业越需要一个能统一治理的控制面。
企业 Agent 的现实边界仍然很硬,当前市场里“Agent washing”现象明显。 Gartner 预计到 2027 年,超过 40% 的 agentic AI 项目会因成本上升或商业价值不清晰而被取消,并预计到 2028 年 33% 的企业软件将包含 agentic AI、15% 的日常业务决策将由 agentic AI 自主做出;与此同时,MIT 的 2025 AI Agent Index 指出大部分 agent 开发者对安全、评测和社会影响透明度仍然有限。
企业工作流比公开 demo 难得多,真正的瓶颈是隐藏状态、级联副作用和跨系统可靠执行。 ServiceNow 的 World of Workflows 基准显示,企业系统的隐含流程与不可见状态会使前沿模型出现“dynamics blindness”;Salesforce 的 SCUBA 基准则显示,零样本下开源模型驱动的 computer-use agents 在真实 CRM 工作流上的成功率不到 5%,闭源方法也仅能做到 39%,在加入示范后提升到 50% 左右;APEX-Agents 中,跨应用长链条知识工作任务的最佳 Pass@1 仍只有 24%。这意味着未来 12–24 个月的核心投资变量不是“谁先发了 Agent”,而是谁能把 Agent 从 demo 变成可靠的生产系统。
从投资上看,最值得关注的不是“Agent 概念所有受益者”,而是三类公司: 一类是平台型直接受益者,已经能把 Agent 转化为新合同、新 usage、新 backlog 的公司;一类是治理/可观测/权限层受益者,因为生产化越深入,治理越刚需;一类是高工作流壁垒垂直 Agent 应用,尤其是客服、ITSM、代码、法律、财务与研究。相反,仅有 Agent 宣传、缺乏收入证据的公司,短期更可能只是防御性叙事。
产业链全景与架构
先讲结论:AI Agent 产业链不是“模型公司—应用公司”两层,而是“模型/工具能力—编排执行—连接器与权限—数据检索与记忆—治理与可观测—业务系统入口—垂直执行应用”七层堆叠。 企业价值最高的地方通常不在最底层,而在最靠近真实工作与可审计执行的地方。OpenAI、Anthropic、Amazon Bedrock 都已经把 agent loop、工具调用、MCP、guardrails、人类审批、状态管理做成标准能力;Google、Microsoft、ServiceNow、Workday、Atlassian 则在其企业平台里把这些能力继续接到了 SSO、数据源、用户权限和业务工作流之上。
| 产业链位置 | 细分环节 | 核心产品/能力 | Agent 需求驱动 | 主要收入模式 | 竞争壁垒 | 利润率特征 | 代表公司 | 受益强度 | 投资弹性 |
|---|---|---|---|---|---|---|---|---|---|
| 基础模型 | 推理、工具调用、长上下文、多模态、computer use | Tools、function calling、tool search、computer use、server tools | 让 Agent 能规划、看屏幕、用工具、调用代码/搜索 | token、API、托管工具、企业订阅 | 模型效果、延迟、成本、企业合规 | 毛利受算力与价格战压制 | OpenAI、Anthropic、Mistral、Cohere、AWS Bedrock Agents | 高 | 高 |
| Agent API / SDK | 状态、编排、护栏、审批、可观测 | Agents SDK、AutoGen、Semantic Kernel、DSPy | 降低构建 Agent 的工程复杂度 | 开源 + 托管服务 / 企业支持 | 开发者生态、部署体验 | 单卖 SDK 利润并不稳 | OpenAI SDK、AutoGen、Semantic Kernel、DSPy | 中 | 中 |
| 编排框架 | 多 Agent 路由、handoff、任务规划 | LangChain/LangSmith、CrewAI、LlamaIndex、Mistral Agents | 复杂任务必须拆解与可重放 | OSS + 观测/部署平台 | 生态与运维能力强于框架本身 | 纯框架易被压价 | LangChain、CrewAI、LlamaIndex、Mistral | 中 | 中高 |
| 工具与连接层 | MCP、函数调用、企业连接器、浏览器/桌面 | Remote MCP、Connectors、Teams/HubSpot/Slack 等插件 | Agent 要进入企业真实系统 | usage、连接器套餐、平台抽成 | 连接器广度 + 权限映射 + 稳定性 | 高毛利但需持续维护 | OpenAI MCP、MCP 协议、Atlassian Rovo、Google Gemini Enterprise | 高 | 高 |
| 数据与记忆层 | RAG、文档解析、权限感知检索、状态存储 | enterprise search、knowledge base、document OCR | Agent 可靠性依赖上下文质量 | 席位、查询量、存储、平台包 | 权限感知检索、企业数据接入 | 较高毛利 | Google Gemini Enterprise、AWS KB、LlamaIndex | 高 | 中高 |
| 治理与可观测 | tracing、evals、policy、审计、human-in-the-loop | LangSmith、guardrails、AI Control Tower、Digital Wallet | 生产化后最刚需 | 企业订阅、usage、审计模块 | 合规、可追责、跨模型中立 | 高毛利 | OpenAI guardrails、LangSmith、ServiceNow AI Control Tower、Salesforce Digital Wallet | 很高 | 高 |
| 企业 Agent 平台 | 统一数据、权限、工作流、UI 与市场 | Copilot Studio、Agentforce、Gemini Enterprise、Rovo、Workday ASOR | 企业不买“单点 Agent”,买“可治理的 Agent 操作系统” | 席位 + usage + credits + 附加模块 | 安装基数、系统入口、身份、流程资产 | 最优 | Microsoft、Salesforce、Google、Atlassian、Workday、ServiceNow | 很高 | 很高 |
| 企业工作流 Agent | ITSM、客服、销售、HR、法务、财务 | 预置 agent + agent builder | ROI 可量化、预算来源清晰 | per seat / per case / per action / per conversation | 域数据与业务流程知识 | 视场景而定 | ServiceNow、HubSpot、Workday、Zoom、Salesforce | 很高 | 高 |
| 垂直原生 Agent | 代码、客服、法律、研究、医疗 | coding agents、customer agents、legal agents | 可替代人工或低端软件座席 | usage、成果分成、席位/credits | 领域工作流与反馈数据 | 可很高 | 目前多在未上市,收入披露不充分;应优先跟踪已接近工作执行闭环者 | 高 | 很高 |
| 被替代层 | 传统 RPA、单点客服插件、低端 SaaS 组件、BPO | 脆弱脚本、座席外包、只读知识库 | Agent 以更少人/更少席位完成更多任务 | 传统席位/人力小时 | 壁垒弱、预算易被抽走 | 利润承压 | 受冲击的是“没有流程与权限护城河的工具/服务层” | 负向 | 高 |
一个典型企业 Agent 系统,今天大体由十四个关键部件构成:模型层、编排层、工具调用层、数据检索层、memory 层、权限层、身份认证层、工作流层、审批层、可观测性层、安全治理层、成本控制层、业务系统集成层、用户界面层。 从护城河角度看,最稳的不是模型层,而是权限层、业务系统集成层、工作流层和治理层;从最容易开源替代的角度看,最脆弱的是编排框架、prompt/agent wrapper、通用 memory abstraction;从最容易被云厂商/模型厂商内置的角度看,基础工具调用、Agent builder、简单 RAG 与基本 observability 最危险。
如果一定要回答“哪一层最值得给高估值”,我的答案是:不是最底层的模型,也不是最表层的聊天 UI,而是“离真实工作责任最近”的那一层——权限感知的数据与业务操作平面。 因为真正能收钱、能续费、能形成客户壁垒的,不是“它会不会生成”,而是“它能不能代表企业去做事,并且出了问题能不能查、能不能拦、能不能纠偏”。ServiceNow、Workday、Google、Microsoft、Atlassian 的产品设计几乎都在朝着这个方向收敛。
商业模式与财务弹性
AI Agent 平台如何收费? 公开资料已经给出清晰答案:未来主流不会是单一计费,而是席位费、消耗费、结果费并存。Microsoft 一边保留 Microsoft 365 Copilot 的 $30/用户/月,一边把 Copilot Chat 的 Agent 扩展为按 message / Azure meter 的 pay-as-you-go;Salesforce 同时提供 $2/会话、$500/10 万 Flex Credits、$5/用户/月的 Agentforce User License;Atlassian 把 Rovo 基础能力并入其云订阅,再把 Rovo Dev 按 $20/开发者/月 + 超额 credits 出售;HubSpot 则将部分 Breeze 能力免费、部分内嵌进套餐、部分 Agent 以 HubSpot Credits 结算;Zoom 的 AI Companion 继续“默认捆绑”,再用 Custom AI Companion 做附加收费。
| 公司 | 公开定价信号 | 计费逻辑 | 对 ARPU / NRR 的含义 | 备注 |
|---|---|---|---|---|
| Microsoft | M365 Copilot 维持 $30/用户/月;Copilot Chat agent usage 走 pay-as-you-go,generative answers 与 Graph grounding 按消息计费 | 员工助手更适合 seat;流程执行更适合 usage | 有望抬高 ARPU,但也可能让部分用户先用免费/低费层,再逐步转化 | 商业模式更像“seat to train habit, usage to monetize automation” |
| Salesforce | Conversations $2/会话;Flex Credits $500/10万 credits;Agentforce User License $5/用户/月 | 对外客服型适合会话;跨用例平台适合 credits | 最利于 RPO/RPO 可见度,因为能预采购 + 超额结算 | 是目前最清晰的企业 Agent usage 商业化样板之一 |
| Atlassian | Rovo 已并入付费云计划;Rovo Dev $20/开发者/月,含 2,000 credits,超额 $0.01/credit | 基础 AI 防御性捆绑 + 开发 Agent 独立变现 | 有利于提升整体留存,但新增收入更偏 Rovo Dev | 更像“平台防守 + 高价值场景抽税” |
| HubSpot | Breeze 一部分免费;部分 Agent 使用 HubSpot Credits | 从 seat 向 credits 过渡 | 有机会提高 ARPU,但市场担心席位被压缩 | 典型的“Agent 既增收又可能蚕食席位”案例 |
| Zoom | AI Companion 默认随 Zoom Workplace 提供;Custom AI Companion 附加 $12/月 | 捆绑作为留存工具,增量通过 add-on | 更偏防御 | 证明“并非所有 Agent 都会单独收费” |
按席位收费的优点是采购简单、预算确定、适合员工协作助手;缺点是当 Agent 替代人类操作后,客户会开始追问“为什么一个机器人还按人头收钱”。按任务/流程/结果收费的优点是 ROI 更容易对齐,适合客服、销售外呼、票据处理、合同审查、工单流转等场景;缺点是预算预测更难、客户一开始不愿意开“空白支票”。因此可以预见未来 2–3 年最常见的形态是:底座保留 seat,自动化执行层改用 credits / conversations / actions / usage。
Agent 会提高 SaaS ARPU,还是减少席位?答案是两者都会发生,但发生在不同公司与不同场景。 如果公司拥有强 system-of-record 与 workflow-control,Agent 往往会先提高 ARPU、带来 usage 增长,并强化客户粘性;如果公司只是围绕人工用户的单点工具,Agent 则会压缩席位、降低 seat expansion。HubSpot 就是公开市场最典型的“被投资者担心 AI 提效后人员变少、从而冲击 seat 模式”的案例;UiPath 则面临另一种压力——RPA 需要证明自己能升级为 agentic automation 编排层,否则会被平台型软件与模型工具层向下吞噬。
模型调用成本如何影响毛利率? 这会是未来 12–24 个月企业软件最大的利润率分化变量之一。Anthropic 官方文档已经明示 server-side tools 存在额外 usage-based pricing;Microsoft、Salesforce、Atlassian、HubSpot 的产品定价也都在向 credits/meter 迁移,本质上是把 token 与工具调用成本部分外显给客户。更关键的是,Salesforce 公开的 compound AI 系统部署研究显示,通过模块化推理架构、动态扩缩容和 MLOps,可以把 P95 延迟压低 50% 以上、吞吐提升至 3.9 倍、成本下降 30%–40%。结论很直接:未来 AI 软件毛利率的核心,不只是模型便宜,而是谁能把 agentic workload 做成可优化、可路由、可观测的系统。
| 情景 | 企业 Agent 采用率 | 独立付费率 | 推理成本变化 | 软件公司 ARPU 变化 | 席位数量变化 | 客户留存变化 | 利润率变化 | 受益环节 | 被冲击环节 |
|---|---|---|---|---|---|---|---|---|---|
| 保守 | 低到中;试点多、生产少 | 低;很多仍算 bundle 功能 | 成本下降有限 | 小幅提升 | 稳中微降 | 留存略增 | 毛利率承压 | 平台捆绑、治理、搜索增强 | 单点 seat 工具、脆弱 RPA |
| 基准 | 中;客服/ITSM/代码/销售/HR 开始进入生产 | 中;seat+usage 混合 | 成本持续下降 | 中幅提升 | 重复性岗位席位下降 | NRR/留存明显改善 | 平台型软件利润率改善 | 平台层、治理层、垂直执行 Agent | BPO、客服坐席、低端开发外包 |
| 激进 | 高;Agent 成为主流软件交互层 | 高;大量改为用量/结果付费 | 成本快速下降 | 平台公司显著提价,弱平台公司 ARPU 下滑 | 大幅下降 | 强平台留存显著抬升,弱工具留存恶化 | 强者更强,弱者利润塌缩 | system-of-action 平台、权限治理、连接器市场 | 传统 seat SaaS、单点客服/RPA/外包 |
以上三种情景的锚点,不是拍脑袋:一方面,Gartner 已公开预测到 2028 年 33% 的企业软件将包含 agentic AI、15% 的日常业务决策将由 agentic AI 自主做出;另一方面,它也明确警告 2027 年前超过 40% 的项目可能因 ROI 不清晰而被放弃。因此,最合理的判断不是“Agent 一定会很快吞噬软件”,而是商业化会先在高 ROI 的工作流落地,并通过 installed base 渗透而不是全面重构同时发生。
赛道与竞争格局
企业 Agent 平台是当前最值得重视的大赛道,因为它最贴近预算入口,也最容易把 Agent 直接变成可持续合同。这里的优胜逻辑不是“谁模型最好”,而是“谁最接近用户入口、企业数据、权限系统和执行工作流”。Microsoft 依赖 Microsoft 365、Graph、Entra 与 Copilot Studio;Salesforce 依赖 CRM、Data Cloud、Flow、Slack 和 Agentforce;ServiceNow 依赖其 workflow platform 与 AI Control Tower/Autonomous Workforce;Google 依赖企业搜索、连接器和权限感知问答;Workday 则试图用 Agent System of Record 抢占“数字员工管理”这一新的系统定义。
Agent 编排框架 / SDK是技术上最活跃、资本市场上最容易讲故事,但也最容易开源化和平台化的赛道。AutoGen、Semantic Kernel、DSPy、CrewAI、LlamaIndex、Mistral Agents、Cohere tool use 都在把“构建 Agent”门槛变低;LangChain 之所以商业价值更稳,是因为它已经把重点转向 LangSmith 的 tracing、evaluation、deployment、fleet。换句话说,“能搭”很快会不值钱,“能测、能管、能上线”才开始值钱。
连接器 / MCP / iPaaS 可能是未来利润池被低估的一层。因为 Agent 一旦从“回答”进入“执行”,它就必须接 CRM、ITSM、ERP、邮箱、日历、文档、浏览器、数据库与内部 API。MCP 已被描述为跨客户端与服务器的开放协议,ChatGPT、Claude、VS Code、Cursor 等都已支持;OpenAI 也把 remote MCP 直接列为工具类型。开放标准会削弱封闭平台的格式壁垒,但不会削弱企业对认证、审计、权限映射和连接稳定性的付费意愿。因此连接器会开源化,连接器运营与治理不会。
治理、安全与可观测性 是最像“下一代中间件”的赛道。它的价值不在 demo 阶段,而在“项目一旦要上线,公司法务、安全、审计、IT 就突然必须买”。OpenAI 的 guardrails 与 human review、Anthropic 的 strict tool use、Google 的 access controls 与 user-level access、ServiceNow 的 AI Control Tower、Salesforce 的 Digital Wallet 与使用监控,都在说明:Agent 一旦执行真实动作,治理从可选项变成商业必需品。 从投资逻辑看,这一层通常具备高毛利、高复购和高切换成本,只是短期市场规模不会像 frontline application 那么大。
最先落地的工作流 Agent,不是最酷的通用助理,而是最“无聊”的高频流程:IT 工单、客服工单、销售跟进、会议后续、文档研究、合同分析、费用与假勤查询、编码与 code review。原因不是技术偏好,而是这些场景能直接连接“减少人力”“缩短 cycle time”“提高吞吐”“提高首解率”等财务指标。Workday、HubSpot、Zoom、ServiceNow、Salesforce 的公开产品路线都证明了这一点。
对传统软件与服务业的冲击 会先发生在四类地方。第一类是座席密集、单点功能的 SaaS;第二类是依赖静态脚本和模板的传统 RPA;第三类是低端呼叫中心与 BPO;第四类是低端软件开发外包和简单报表/研究外包。企业最终会逐步把大量预算从“买一个人用的软件”迁移到“买一个能完成任务的系统”。但要注意,拥有 system of record、领域数据和流程控制权的老牌软件商,不一定被颠覆;它们更可能被迫从system of record 升级为 system of action。这也是为什么 ServiceNow、Workday、Microsoft、Salesforce、Atlassian 比纯粹的“AI 助手壳子”更值得重视。
从竞争格局看,我的排序是:Microsoft 与 ServiceNow 是“企业 Agent 控制平面”的最强候选,Salesforce 是“客户工作流与外部服务 Agent”的最强候选,Palantir 是“高价值复杂工作流与政府/工业系统 Agent”的高弹性候选,Google 与 Workday 是“搜索/知识与数字劳动力管理”的潜在强平台,Oracle 更偏基础设施和数据库/行业 SaaS 的配套受益者。 但若从“市场是否已充分反映预期”看,Palantir 最贵、Microsoft 最稳、Salesforce/ServiceNow 风险收益比更平衡、HubSpot/UiPath 的预期差更大。 这不是买卖建议,而是“确定性—弹性—估值”三轴下的相对判断。
标的分层与评分
下面的分层只针对当前公开资料中最有证据支持的公司;没有把所有区域公司都强行归类,是因为很多公司只发布了 Agent 功能,却没有披露 Agent 收入、ARR、usage、RPO 或客户转化证据。
| 类别 | 公司/类型 | Agent 受益路径或冲击路径 | 证据强度 |
|---|---|---|---|
| A 类:核心直接受益者 | Microsoft | 以 Copilot + Copilot Studio + Graph + Entra 把 Agent 嵌入办公与业务流程;AI 业务年化收入运行率已超过 370 亿美元,具备最强 installed base 变现能力。 | 很高 |
| A 类:核心直接受益者 | Salesforce | Agentforce 已有清晰的 conversation / credits / seat 定价,且公开材料已出现数千到上万单的交易与 Data Cloud+AI ARR 信号,是平台层里最像“usage revenue engine”的公司。 | 很高 |
| A 类:核心直接受益者 | ServiceNow | AI 已进入合同价值与大客户扩张的公司级披露,且平台天然拥有 workflow、审批、权限与工单入口。 | 很高 |
| A 类:高弹性直接受益者 | Palantir | AIP 正在把公司从“数据平台”推进到“可执行的 operational AI”,Q1 2026 美国商业收入同比增长 133%,是最强成长弹性之一。 | 很高 |
| B 类:受益明显但竞争/估值风险高 | Oracle | 直接受益于 AI 云合同与数据库/行业套件接入 Agent;RPO 爆发,但更偏 infra 与大型合同,不完全是应用层 Agent beta。 | 高 |
| B 类:受益明显但收入拆分仍有限 | Atlassian | Rovo + Teamwork Graph + 跨工具连接器 + Rovo Dev 独立收费,平台位置优秀;但基础 Rovo 更偏 bundle,新增收入可见度仍在建立。 | 中高 |
| B 类:受益明显但存在模式重构风险 | HubSpot | Breeze 已进入客服、销售、研究与数据工作流,并开始用 credits 计费;但 AI 提效可能反向压缩 seat expansion,市场已开始担忧。 | 中高 |
| B 类:受益明显但竞争压力大 | Workday | 以 Agent System of Record 抢占“数字员工控制台”定义,若企业接受这一叙事,将具备独特平台价值;但公开财务归因尚不充分。 | 中 |
| C 类:主要是防御工具 | Zoom | AI Companion 的 agentic 化有助于留存与套件整合,但当前更像防守型 bundle 与适度附加收费,而不是独立增长引擎。 | 中 |
| C 类:双刃剑公司 | UiPath | 一方面拥有自动化与编排基础,适合作为“RPA 2.0”升级者;另一方面 AI 也在削弱传统 RPA 的独占价值,市场已明显担心其增长放缓。 | 中 |
| D 类:叙事强但财务验证不足 | 大量未单独拆分 Agent 收入的软件公司 | 发布 Agent 功能容易,披露真实付费转化难;Gartner 已提示“agent washing”普遍存在。 | 低到中 |
| E 类:可能被冲击 | 单点 seat SaaS、低端客服/报表插件、低端 BPO / 呼叫中心、脆弱脚本 RPA | 预算可能被平台型 Agent、客服 Agent、编码 Agent 和 outcome-based 自动化吸走。 | 高风险 |
我建议的评分模型仍然沿用你给出的逻辑,但在这轮公开资料验证中更适合做定性+半定量打分:
- Agent 收入直接暴露度:25%
- 产品/数据/工作流壁垒:20%
- 客户质量和收入确定性:15%
- 平台生态与连接器能力:15%
- 财务质量和利润率:10%
- 估值合理性:10%
- 未来催化剂:5%
基于目前证据,我的优先研究排序是:Microsoft、ServiceNow、Salesforce、Palantir、Oracle、Atlassian、HubSpot、Workday、UiPath、Zoom。 这里的排序并不意味着“最应该买”,而是意味着“最值得持续跟踪的 Agent 兑现路径最清楚”。如果只看估值与预期差,我会把 Microsoft/ServiceNow/Salesforce 放在“确定性更高、预期较可管理”的一侧,把 Palantir 放在“兑现最强但估值最热”的一侧,把 HubSpot/UiPath 放在“可能存在预期差,但也伴随模式冲击”的一侧。
对应的被 Agent 冲击风险反向评分,我会把风险最高的对象放在“没有 system of record、没有权限控制、按席位收费、功能可被 Agent 直接替代”的公司与服务商上;而拥有流程编排、身份系统、组织图谱、工单/CRM/ERP/协作入口的公司,即使短期受压,也更可能转型成功。
重点上市公司画像
Microsoft:最强点不只是模型分发,而是把 Agent 嵌到 Microsoft 365、Graph、Entra 和 Copilot Studio 里,把工作场景、权限和办公入口捏在一起。Q3 FY26 公司官方披露 AI 业务年化收入运行率超过 370 亿美元,商业 cRPO 达到 6270 亿美元;Copilot Studio 支持 instructions、triggers、knowledge、tools 和嵌入式部署,商业模式既保留 $30/席位,也引入按 message 计量的自动化 usage。最大优点是 installed base 和渠道,最大风险是估值对 AI 的反映已很充分、且免费/低费层可能压制付费转化速度。
Salesforce:这是当前最值得盯住的“企业 Agent usage 商业化样板”。Agentforce 已不是泛泛的发布会概念,而是把会话、action、credits、seat 组合成可结算的一整套模式;公开市场已经看到其累计交易数与 Data Cloud+AI ARR 走向实质规模。它的核心护城河不是模型,而是 CRM 数据、Flow、Slack、MuleSoft、Data Cloud、行业云和客服入口。风险在于:Agentforce 今年的增量仍被市场质疑能否足够快地拉动整体增速,而 Salesforce 自己也在大幅采购模型 token,推理成本与产品毛利需要持续验证。
ServiceNow:如果把 Agent 时代比作“软件从数据库走向执行系统”,ServiceNow 是最天然的受益者之一,因为它本来就是工单、审批、流程和跨部门工作流的大脑。AI Agents/Autonomous Workforce 明确强调角色、业务上下文和权限;公司 2026 年公开表示 AI 合同价值有望超过 15 亿美元,Q1 2026 Now Assist 年 ACV 超过 100 万美元的大客户同比增长逾 130%,RPO 也继续扩张。最大的优点是工作流护城河与企业级治理位置,最大的风险是市场担心 AI 最终会削弱部分传统 workflow seats 的必要性。
Palantir:AIP 是目前上市软件里最接近“Agent 真正在复杂真实系统里执行”的公司之一。Q1 2026 Palantir 总收入同比增长 85%,美国商业收入同比增长 133%,管理层把 AIP 描述为“every agent action is governed, attributed and auditable”的 no-slop zone,这个表述非常重要,因为它正好抓住了 Agent 商业化的核心——可靠执行而非炫技。它的护城河在高复杂度系统整合、前线工程团队和政府/工业场景;风险则是估值已经隐含了极高的持续高增长预期。
Oracle:如果只讨论“企业 Agent 平台”,Oracle 不是最性感的名字;但如果讨论“谁会因为企业 Agent 推理量、数据库接入、行业 SaaS 和 AI 云合同而显著增收”,Oracle 非常值得研究。Reuters 披露其 FY26 Q3 RPO 同比增长 325% 至 5530 亿美元,增长主要由大规模 AI 合同驱动;同时,Oracle 官方也持续强调 AI agents 与高质量企业数据、ERP/HCM 系统集成的价值。它的受益路径更偏“底层 infra + database + app suite”,而不是最前台的 Agent UX。
Atlassian:Rovo 的战略价值高于短期收入体量。它最关键的资产是 Teamwork Graph,把协作、项目、会议、文档、代码和目标上下文连起来,再通过广泛连接器与 MCP 把上下文扩展到外部工具;Rovo Dev 则是其最有机会独立收费并拉高 ARPU 的 Agent 产品。对投资来说,Atlassian 更像“平台型长期受益者”,而不是短期业绩爆发的纯 Agent 票。
HubSpot:Breeze 证明 HubSpot 不只是把 AI 做成一个写文案按钮,而是在尝试把客服、销售拓客、公司研究、数据问答变成可执行的 agent teammates,还引入 marketplace 和 credits。问题也恰恰在这里:HubSpot 的 seat-based 成长模型可能被 AI 提效反噬。市场已经开始用更高的怀疑眼光审视它,Barron’s 明确指出投资者担忧 AI 可能减少人类用户、从而削弱公司传统 seat 增长。它是典型的“Agent 增强型公司”,同时也是“Agent 对自身旧模式的冲击样本”。
Workday:Workday 在产品定义上可能是最超前的,它不只做 Agents,而是提出了 Agent System of Record,试图把员工与数字员工放在一个系统里管理,并给出 analytics、ROI 与技能级控制。若这一套被大型企业采纳,Workday 会从 HR/Finance system-of-record 进化为数字劳动力控制台。问题在于,目前公开财务披露里还缺少足够清晰的 Agent 独立收入证据,因此更适合列入重点跟踪名单,而不是直接归入已兑现。
Zoom:Zoom 的 AI Companion 路线说明,不是所有公司的最佳策略都是“新 SKU + 高价加购”。它把 agentic 功能嵌入会议、任务、文档与视频工作流,并继续以“默认增强”的方式稳住套件价值,再用 Custom AI Companion 做适度加价。这种模式对提升留存和抑制产品同质化有帮助,但短期更偏防御而非爆发。
UiPath:UiPath 是最典型的“双刃剑”。一方面,它拥有自动化、编排、机器人执行和流程资产,看上去理应成为 RPA 2.0 的受益者;另一方面,市场也最担心 LLM Agent 会把传统 RPA 的脚本型价值吃掉。Barron’s 对 FY2027 指引放缓的反应和市场对 AI 竞争的担忧,说明 UiPath 必须证明自己不只是“旧 RPA 加上点 GenAI”,而是真正成为 Agent orchestration / governance 平台。它值得跟踪,但风险显著高于 Microsoft / Salesforce / ServiceNow。
Google / Alphabet:Gemini Enterprise 的产品定义非常清晰——它不是单一助手,而是 intranet search、AI assistant 与 agentic platform 的合体,带 permissions-aware access、预置连接器、Agent Gallery、SSO 与用户级访问控制。问题在于,对 Alphabet 来说,Agent 的收益会被广告、云和搜索的巨大体量稀释,所以更适合被视为“战略重要但投资 beta 不纯”的标的。
Amazon:Amazon Bedrock Agents 把 prompt engineering、memory、monitoring、encryption、user permissions 与 API invocation 一体托管,产品方向非常对;但从股票映射看,这更像 AWS AI 基础设施和平台能力的一部分,而不是可独立估值的 Agent 业务。对投资者而言,AWS 受益清晰,Agent 业务归因不清。
候补观察名单:如果要继续扩展到更多上市软件公司,我会优先把 SAP、GitLab、Pegasystems、NICE、Five9、Datadog、CrowdStrike、Okta 放入下一轮跟踪名单;不是因为它们一定都会成为核心赢家,而是因为它们分别位于 ERP/开发/流程/客服/可观测性/安全/身份这些 Agent 时代的关键节点。但这一轮对这些公司的“Agent 收入落地”验证不足,因此不宜在本报告里给出过度确定的财务判断。
风险、误区与后续研究
最大误区是把 Agent 研究做成“谁发布了功能最多”。真正重要的只有三件事:第一,Agent 是否进入生产;第二,Agent 是否进入计费;第三,Agent 是否改变客户预算结构。 Gartner 已经公开提醒大量 agentic 项目可能被砍,MIT 的 Agent Index 也提示行业透明度低;而 ServiceNow WoW、Salesforce SCUBA、APEX-Agents 这些基准进一步说明,从公开 demo 到企业生产之间隔着巨大的可靠性鸿沟。
从风险拆解看,最关键的十八项风险里,有六项尤其值得投资者持续盯:落地低于预期、付费率低于预期、权限/数据泄漏、安全事故、推理成本压缩毛利、平台挤压独立软件空间。 公开平台文档已经把这些问题写进了产品结构:OpenAI 强调 human review 与 guardrails,Anthropic 给 strict tool use 和 sandbox computer use,Google 强调 access control 与 user-level access,Workday 强调 human oversight 与 analytics,ServiceNow 强调 AI Control Tower,Salesforce 用 Digital Wallet 去可视化 usage。市场正在给“能把风险工具化”的公司更高的质量溢价。
最终研究结论可以压缩成十句话。
第一,AI Agent 在产业链中的位置,不是“又一个 AI 应用”,而是把基础模型变成可执行软件劳动力的中间操作层。
第二,最值得关注的五个细分赛道是:企业 Agent 平台、治理/权限/观测层、客服与 ITSM Agent、AI coding agents、连接器/MCP/iPaaS 层。
第三,最值得深入研究的上市公司,优先是:Microsoft、Salesforce、ServiceNow、Palantir、Oracle、Atlassian、HubSpot、Workday、UiPath、Zoom。 其中前四家是“兑现证据最强”,中间三家是“平台位置极佳但仍需验证财务拆分”,后两家是“模式正在被重构,因此预期差更大”。
第四,最值得跟踪的未上市方向,不应再是“再做一个通用 Agent 壳子”,而应是AI coding、AI 客服、Agent 治理/观测、企业连接器/MCP、文档 intelligence / memory、垂直法律/医疗/金融 Agent。这一层的大量公司收入仍未充分公开,必须用客户名单、付费模式和使用深度去筛选,而不能靠 demo 热度。
第五,最容易被市场误解的点,是把 Agent 当成“模型升级”;更准确地说,Agent 是软件商业模式升级。收入归属会从 seat 向 seat+usage+outcome 迁移。
第六,未来 6–12 个月最值得跟踪的指标,不是 MAU,而是:Agent 单独收入、credits 消耗、conversation/action 数、RPO/cRPO、AI 大客户数、NRR、推理成本、自动处理率、人工转接率、安全事故数。 这些才决定 Agent 能否从产品发布走向利润兑现。
第七,Agent 增强型软件公司 是将 Agent 嵌入现有产品来提高留存、扩张与差异化的公司,例如 Atlassian、HubSpot、Zoom、Workday。
第八,平台型 Agent 公司 是真正掌握企业身份、权限、数据入口和工作流的公司,例如 Microsoft、Salesforce、ServiceNow、Google、Workday。
第九,Agent 原生挑战者 将主要出现在代码、客服、研究、法律和垂直专业流程中,它们会优先抢占预算而不是先抢座席。这个层次的上市映射还很少,一级市场机会明显多于二级市场。
第十,最可能被冲击的传统软件或服务公司,不是所有老软件公司,而是没有数据壁垒、没有权限壁垒、没有工作流壁垒、主要按席位收费的点状工具与低端外包服务。
开放问题与局限:本报告对北美公开披露最充分的公司覆盖最深;中国、欧洲、日本、韩国、印度的大量公司目前缺乏足够清晰的 Agent 收入拆分公开数据,因此更适合进入下一轮本地语言与本地资本市场口径的专项研究。另一个局限是,许多公司并未在公开资料中逐一披露 Agent 相关 ARR、NRR、RPO/cRPO、精确估值倍数与模型成本,因此对这些字段我刻意没有做超出公开证据的填充。
更窄的后续研究方向:如果只选择一个继续深挖,我建议优先研究 企业 Agent 治理与权限控制。原因是:这层最容易被低估、最不容易被开源完全替代、最能横跨各模型与各 Agent 平台,同时最直接承接企业上线前的真实预算。排在第二位的专项方向,是 AI 客服 Agent,因为它是最先看到真实计费和流程替代的前线应用。