研报 · AI 药物研发

AI 药物研发与生命科学平台深度研究

AI 药物研发(赛道研究)
SECTOR · AI
导读

AI 药物研发进入分层商业化——最先兑现收入的不是"AI 发明新药",而是药企研发流程的软件、数据、仿真、临床与合规平台。FDA 2016-2023 已收 500+ 含 AI 组件的药品监管提交。五类清晰商业价值:计算化学软件、biosimulation、临床试验/RWD、研发数据平台/ELN/LIMS、自动化实验。短中期利润池在"卖铲人"和"流程平台"(Veeva、IQVIA、Certara、Schrödinger、Tempus、Thermo Fisher、Danaher、10x、Illumina);中长期弹性留给平台+管线+闭环实验的 AI-native biotech(Isomorphic、Insilico、Iambic、Generate:Biomedicines、Recursion)。Recursion×Sanofi 总潜在里程碑 $52 亿但落袋的是预付款;Insilico 靶点到 PCC 压缩到 ~18 个月。最易泡沫:AI 蛋白设计/抗体设计/分子生成单点工具——结构预测护城河趋弱(AlphaFold/RoseTTAFold All-Atom 让结构信息商品化)。

速览通俗速览 · 先读这里

AI 药物研发是把 AI 嵌进药企「靶点—分子—临床前—临床—申报」全流程的赛道,FDA 在 2016-2023 已收到 500+ 含 AI 组件的申报。评级跟踪,核心判断是短期利润池在卖铲人、中长期弹性才轮到 AI-native biotech

利润分布跟表层叙事差很多。最先兑现收入的不是「AI 自己发明新药」,而是给药企卖软件、数据、仿真、临床和合规平台这五类「卖铲人」——Veeva FY2026 收入近 32 亿美元、IQVIA 2025 年收入 163 亿美元并握有 12 亿+ 患者记录、Schrödinger 软件毛利率 74%、Tempus 同比增长 83%。真正的弹性留给平台 + 管线 + 闭环实验三位一体的 AI-native biotech,Insilico 把靶点到候选物压到约 18 个月就是样本,但这层目前还没有任何被批上市的 AI 发现药物。单纯做结构预测的护城河正在被 AlphaFold/RoseTTAFold 开源稀释

风险点上,几十亿合作 headline 不等于落袋收入——Recursion 和 Sanofi 总潜在里程碑 52 亿美元,真正进账的主要是预付款。最易泡沫的是无湿实验闭环的纯生成公司和单点蛋白/分子设计工具。买入锚点是工作流嵌得最深的那批平台股:Veeva、IQVIA、Certara、Schrödinger、Tempus;Siemens 用 51 亿美元 EV 买 Dotmatics 已经在给软件层背书。

完整正文

核心结论

  • AI药物研发已经从“科研展示”进入“分层商业化”阶段。最先兑现收入的,并不是“AI自己发明了多少新药”,而是围绕药企研发流程的软件、数据、仿真、临床与合规平台:如 Schrödinger 的计算化学软件、Certara 的 biosimulation、Veeva 的生命科学云、IQVIA 的临床与数据网络、Tempus 的临床-分子数据平台,都已经形成可验证收入。FDA 也明确披露,2016—2023 年间已收到500+含 AI 组成部分的药品监管提交,覆盖非临床、临床、上市后与制造环节。

  • 真实商业价值最清晰的环节有五类: 一是计算化学/结构与分子设计软件;二是biosimulation 与 PK/PD 建模;三是临床试验设计、患者招募、RWD/RWE 分析;四是生命科学研发数据平台、ELN/LIMS、知识图谱与文档合规自动化;五是自动化实验与闭环优化。相较之下,“仅有基础模型、没有自有数据和湿实验闭环”的资产更容易被商品化。

  • AI确实能缩短早期研发周期并减少无效实验,但对整体临床成功率的提升还没有被大样本行业数据完全证明。以 Insilico 为代表的公开案例显示,从靶点识别到临床前候选物提名可压缩到约 18 个月,并通过约 80 个分子完成筛选;Iambic 公开的早期模型结果则声称可显著提高早期可开发性预测精度。真正还缺的是:这些早期效率红利能否稳定传导到 Phase II/III 与上市成功率。

  • 利润池短期主要落在“卖铲人”和“流程平台”,包括软件、数据、仿真、临床与研发 IT 基础设施;中长期弹性最大的利润池,才可能留给拥有平台+管线+闭环实验能力的 AI-native biotech。换句话说,当前最可见的是 ARR、订阅费、服务费和合作预付款;未来最非线性的是里程碑、版税与自研管线 NPV。

  • “合作总金额很大”不等于“收入质量高”。例如 Recursion 与 Sanofi 的总潜在里程碑可达约 52 亿美元,与 Roche/Genentech 的合作也包含巨额里程碑与权利金条款;但真正已经落袋的,是前期预付款与已触发里程碑,而不是 headline deal value。判断合作质量,要看:预付款比例、阶段里程碑密度、由谁承担临床成本、保留权利金水平、是否允许保留自研权益。

  • 真正处在平台核心位置的公司,不是“最准的模型公司”,而是同时掌握专有数据、实验回路、药企工作流接口、客户关系、监管语境的公司。代表性样本包括:Recursion(高维表型+CRISPR phenomap)、Tempus(临床-分子数据网络)、IQVIA(全球 RWD 与 CRO 网络)、Veeva(生命科学行业云)、Certara(监管接受度极高的 biosimulation)、Benchling/Dotmatics(研发数据/实验记录基础设施)。

  • AI-native biotech 中,最值得研究的不是“最会讲模型故事”的公司,而是同时满足四个条件的公司: 有药企重复合作;有自研或合作项目进入临床;有能够持续复用的数据资产;有能把模型输出转成实验/临床决策的组织能力。现阶段较符合这一筛选框架的包括 Isomorphic Labs、Insilico Medicine、Iambic、Generate:Biomedicines、Recursion。

  • “蛋白结构预测”本身的超额利润池并不大,真正的利润池在下游。AlphaFold 及其生态极大降低了结构信息的稀缺性;RoseTTAFold All-Atom 亦推进了复合物建模与设计。因而,单纯做“结构预测”的公司护城河趋弱;更有价值的是将结构、序列、功能、可制造性与湿实验反馈整合进生产系统的公司。

  • AI蛋白设计、抗体设计和分子生成是最容易“泡沫化”的赛道之一,因为 demo 很容易,真正的药学可开发性、CMC、毒理和临床转化很难;与之相对,研发数据平台、biosimulation、临床试验 AI、合规文档自动化、研发操作系统更可能形成长期复利。

  • 上市公司里,收入验证最强的 AI 受益者大多不是纯 AI 药物研发公司。从“收入已落地、客户已验证、毛利率可见”的角度,Veeva、IQVIA、Certara、Schrödinger、Tempus、Thermo Fisher、Danaher、10x Genomics、Illumina 的可跟踪性强于多数临床前 AI-native biotech。

  • AI叙事强、商业化弱的典型风险画像包括:收入极度依赖一次性合作确认;平台使用频率和复购率未披露;没有重复大药企客户;没有进入临床的自研/合作项目;现金消耗快于合作兑现;估值提前透支临床成功率。用户对这类公司最需要警惕“里程碑错觉”和“模型能力错觉”。这一风险在部分早期 AI-native biotech、自动化实验室以及“泛生物基础模型”公司身上尤其明显。

  • 并购已经在验证“生命科学研发软件层”的价值,而不是仅验证“模型层”。Siemens 以 51 亿美元企业价值收购 Dotmatics,明确是为扩展其 AI 驱动的生命科学研发软件版图;公开报道还显示,Roche 拟以最高 10.5 亿美元收购 PathAI,如若完成,将进一步验证 AI 病理/临床研发软件资产的战略价值。

  • 未来 12—24 个月的最大催化剂不是论文,而是三类事件: AI 发现分子在 II 期读数上的连续性;大药企合作从“探索性合作”升级至“开发与商业化权利转让”;生命科学研发 IT 与自动化平台出现更大额并购。当前已可跟踪的代表事件包括:Insilico 临床进展、AbCellera 的 ABCL635/575 读数、Generate 的 GB-0895 III 期推进、Isomorphic 首批进入人体研究、以及更多类似 Dotmatics/PathAI 的并购。

  • 最大的长期风险不是模型不够大,而是生物学过于复杂、转化环节噪声太大,以及基础模型快速开源后技术壁垒外溢。FDA/EMA 当前都在强调风险导向、可解释性、数据治理与适用边界,这本质上说明:监管机构接受 AI,但不接受“黑箱替代验证”。

  • 最容易被市场误解的点是: “AI药物研发”不是单一赛道,而是由软件平台价值、数据资产价值、实验闭环价值、临床验证价值、药物管线价值共同组成;同一种公司名义上都叫“AI biotech”,经济学却完全不同。

产业链全景与利润池判断

验证梯度先于估值。 在本主题中,最重要的不是“AI 很强”,而是公司处在哪一个验证层级: 科研突破(如 AlphaFold 3、RoseTTAFold All-Atom)→ 平台合作(如 Isomorphic、Recursion、Generate、Insilico 与大药企签约)→ 收入落地(如 Schrödinger、Certara、Veeva、IQVIA、Tempus、BenchSci)→ 临床验证(如 Insilico、AbCellera、Generate、Relay)→ 药物上市(本文覆盖样本中,尚未看到由纯 AI-native biotech 以“AI发现”作为核心叙事并被主流监管机构正式批准上市的明确样本;该点仍需持续验证)。

利润池分布的核心判断是: 短期最赚钱的层在“研发流程数字化与仿真化”,中期看“平台+服务+合作”,长期看“平台+管线+权益”。单纯模型层最容易被开源和云厂商稀释;单纯 CRO 劳务层最容易被效率提升压价;真正的长期高壁垒在专有数据 × 自动化实验 × 药企工作流嵌入 × 临床/监管可用性。这也是为什么 Siemens 收购 Dotmatics、药企采购 Veeva/Benchling/Certara/IQVIA,而不是只采购一个通用大模型。

产业链位置 细分环节 核心产品/能力 AI需求驱动 收入模式 主要客户 数据壁垒 实验壁垒 监管壁垒 利润率特征 代表公司 上市/未上市 受益强度 投资弹性 关键来源
数据层 基因组数据 测序、变异检测、样本数据库 靶点发现、患者分层、伴随诊断 仪器+耗材+服务 药企、医院、科研 低-中 耗材型较稳 Illumina、PacBio、Oxford Nanopore、华大基因 上市/未上市混合
数据层 蛋白组/质谱数据 蛋白组学、质谱 机制与生物标志物识别 仪器+耗材+软件 药企、CRO、科研 低-中 工具公司中高毛利 Thermo Fisher、Bruker、Waters 上市
数据层 单细胞/空间组学 单细胞、空间转录组 细胞状态建模、靶点验证 仪器+试剂+分析软件 药企、学术、biotech 初期波动、长期高价值 10x Genomics、Bruker Spatial 上市
数据层 临床数据 EHR、分子-临床纵向数据 入组、分层、RWE、终点优化 检测+数据订阅+pharma服务 药企、医院 很高 平台化后毛利提升 Tempus、IQVIA 上市 很高
数据层 真实世界数据 患者记录、claims、registry 外部对照、药物安全、上市后研究 数据许可+分析服务 药企、监管支持 很高 很高 高粘性 IQVIA、Owkin 上市/未上市 很高 中高
数据层 科研数据平台 ELN/LIMS/知识图谱/数据湖 把分散实验数据转为可训练资产 SaaS 订阅 药企、biotech、CRO SaaS 高毛利 Benchling、Dotmatics、Veeva 未上市/被收购/上市 很高
模型层 生物基础模型 蛋白/细胞/多模态 foundation model 设计、预测、问答、co-pilot API/平台/合作 药企、AI-biotech 若开源则有限 纯模型利润率不稳 Isomorphic、EvolutionaryScale、Profluent 未上市
模型层 蛋白结构模型 结构与复合物预测 更快定位结合位点和设计空间 研究合作/平台化 药企、科研 易商品化 AlphaFold 生态、RosettaFold 生态 平台/开源 低-中
模型层 分子生成模型 生成、优化、可开发性预测 提高 hit-to-lead、lead optimization 效率 软件+合作+管线 药企、AI-biotech 若无闭环则弱 Insilico、Iambic、Recursion 上市/未上市 很高
发现层 AI靶点发现 多组学、疾病网络、因果建模 提高靶点命中率、缩短验证时间 合作研发+里程碑 大药企 中高 早期收入波动 Recursion、BenchSci、Xaira 上市/未上市
发现层 小分子设计平台 物理模拟+生成设计 提升化学效率与候选质量 软件许可+合作+自研 药企、biotech 软件毛利高;管线亏损高 Schrödinger、Iambic、Insilico 上市/未上市 很高 很高
发现层 抗体/蛋白设计平台 抗体发现、序列设计、可制造性优化 生物药优化、双抗/ADC/TCE 合作研发+里程碑+版税 大药企 很高 若成功,权益价值大 AbCellera、Generate、BigHat、Cradle 上市/未上市 很高 很高
实验层 自动化实验室 机器人、工作站、工作流编排 降低人工、支持主动学习闭环 设备+软件+服务 药企、CRO、研究机构 很高 初期重资产,后期改善 Opentrons、Strateos、ECL、Thermo Fisher 未上市/上市 中高
实验层 高通量筛选 HTS、表型筛选 构建训练数据与 hit 发现 服务费+平台合作 药企、biotech 很高 服务毛利一般 Charles River、WuXi、Recursion 上市 中高
实验层 临床前验证 ADMET、毒理、体外模型 减少早期淘汰错误 软件+服务 药企、biotech 中高 Certara 类毛利好;传统外包中等 Certara、Charles River 上市
临床层 临床试验设计 方案设计、站点选择、风险监控 降低入组失败与执行延误 SaaS+服务费 大药企、CRO 很高 高粘性 IQVIA、Veeva、Tempus、泰格医药 上市 很高 中高
临床层 AI患者招募 EHR 筛选、试验匹配 缩短 enrollment 服务费/平台费 药企、CRO、医院 很高 很高 高价值但需网络效应 Tempus、IQVIA 上市 很高 中高
临床层 药物安全与医学写作 PV、监管写作、提交自动化 降低合规和人力成本 SaaS+服务 药企、CRO 很高 高粘性 Veeva、Certara、泰格医药 上市 中高
平台层 药企研发平台 行业云、研发 Copilot、文献与专利挖掘 提升组织级研发效率 SaaS 订阅 大药企 SaaS 复利强 Veeva、Benchling、Dotmatics 上市/未上市/被收购 很高
平台层 CRO/研发外包 AI辅助项目交付 提高产能与毛利 FTE/项目制 药企、biotech 中高 容易被压价 IQVIA、WuXi、Tigermed、Charles River 上市
平台层 AI-native biotech 端到端平台+自研管线 捕获平台与药物权益双重价值 合作+里程碑+版税+管线 药企/最终患者 很高 很高 波动最大 Isomorphic、Insilico、Recursion、Generate、Xaira 上市/未上市 很高 很高
基础设施层 云和算力 训练/推理/数据管线 大模型、生物模拟、自动化控制 云服务/API 药企、AI-biotech 规模利润 NVIDIA、Google/DeepMind 生态、云厂商 上市
监管层 监管与合规 GxP、模型治理、审评沟通 确保 AI 可接受性 咨询/软件/验证服务 药企、监管申报团队 很高 高附加值 FDA/EMA 指南驱动的服务生态 机构/软件商 很高

简化判断短期确定性最高的是 Veeva、IQVIA、Certara、Schrödinger、Tempus、Dotmatics/Benchling 这类“工作流层”公司; 中期可选性最大的是 Isomorphic、Insilico、Generate、Iambic、Recursion、AbCellera; 间接受益但更像卖铲人的是 Thermo Fisher、Danaher、10x Genomics、Illumina、Opentrons; 最容易被冲击的是低技术密度、低数据含量、低自动化渗透的传统发现外包与手工流程。

商业模式、技术路线与估值框架

AI药物研发公司怎么赚钱。 目前行业已经验证的收入模式可以归纳为六类: 软件订阅/SaaS(Schrödinger、Veeva、Benchling、Dotmatics、Certara); 平台授权与数据访问费(Tempus、IQVIA、部分 BenchSci/Tempus/Recursion 模式); 合作研发收入(Recursion、Generate、Insilico、AbCellera); 里程碑与版税(Recursion、AbCellera、Insilico、Generate、Isomorphic); 自研管线价值(Insilico、Generate、AbCellera、Recursion、Relay); 并购退出价值(Dotmatics 被 Siemens 收购、PathAI 据报道被 Roche 以最高 10.5 亿美元收购)。

哪种模式更优。 如果只看收入质量,排序通常是: 订阅软件 > 深度嵌入式平台费 > 可重复的分析服务 > 预付款合作 > 里程碑/版税 > 单一自研管线估值。 但如果看上行空间,顺序几乎反过来。最优组合往往不是纯软件,也不是纯管线,而是软件/平台现金流 + 部分高质量管线权益。Schrödinger、Certara、Tempus、Veeva这类公司之所以更容易被二级市场接受,是因为它们至少有一部分收入是可预测的;而纯 AI-native biotech 则必须用更高波动换取更高上行。

平台+管线混合模式的优点在于: 第一,可以让药企为平台买单,缓解现金消耗;第二,可以把平台成果以自研管线形式留在自己账上,获得非线性回报;第三,能更快验证平台是否可重复。 风险则在于:组织复杂度高、资本开支大、收入确认波动、平台公司容易逐步“退化”为普通 biotech。Recursion、AbCellera、Generate、Insilico 都在经历这个张力。

如何判断合作协议质量。 高质量协议通常具备: 较高 upfront、较清晰的近端技术/开发里程碑、保留版税或共开发权益、由大药企承担后续临床与商业化成本、且客户有重复购买/扩展合作行为。 例如 Isomorphic 与 Lilly/Novartis 的合作总潜在价值接近 30 亿美元;Generate 与 Novartis 多靶点合作总潜在价值超 10 亿美元,且 upfront 为 6500 万美元;Insilico 与 Lilly 的新版全球合作包含 1.15 亿美元 upfront 和最高 27.5 亿美元潜在总价值;Recursion 则已从 Sanofi 收到 1.34 亿美元预付款及进度里程碑、从 Roche/Genentech 收到 2.13 亿美元预付款和里程碑。

技术路线的价值分层可以概括如下:

技术层 更适合谁切入 长期护城河 付费意愿 被开源/云商品化风险 并购可能性 判断
生物数据层 数据平台/医院网络/药企 极高 很高 很高 最值钱的是独占数据产权与治理能力。
化学数据层 药企、软件平台 中高 需要与实验回路联动。
临床数据层 IQVIA/Tempus/医院网络 极高 很高 很高 受监管与隐私保护,壁垒高。
文献/专利层 研发软件公司 单靠检索不够,需融入工作流。
多组学建模层 AI-native biotech/药企 中高 需要专有实验数据持续反哺。
蛋白结构与设计层 蛋白设计公司/药企 中高 中高 科学价值极大,但纯结构层易开源化。
分子生成层 AI-native biotech/软件平台 中高 中高 真正护城河在数据和 wet-lab。
物理模拟层 计算化学软件公司 很高 中高 付费意愿强,商业化最成熟之一。
ADMET/毒性层 Certara/AI-biotech/药企 很高 中高 紧贴监管与决策。
实验设计层 Benchling/自动化平台 很高 与 ELN/LIMS/机器人绑定后价值大。
自动化实验层 工具公司/云实验室 很高 重资产,但闭环能力最强。
反馈学习层 AI-native biotech 很高 中高 是平台可复利的核心。
临床转化层 Tempus/IQVIA/药企 很高 很高 很高 最接近真实商业结果。
药企协作层 Veeva/Benchling/Dotmatics 很高 很高 很高 一旦嵌入流程,不易替换。
监管合规层 Certara/Veeva/IQVIA 很高 很高 中高 合规决定规模化边界。

三种情景预测

情景 假设 药企AI采用率 AI发现药物进入临床数量 临床成功率提升 平台授权收入 里程碑释放 自研管线价值 最大受益环节 相对受益公司 可能承压公司 主要风险
保守 AI主要提升早研效率,不明显改善临床结局 稳步上升 低或不显著 低-中 中低 软件/临床IT/仿真 Veeva、IQVIA、Certara、Schrödinger 纯故事型AI-biotech 生物学复杂性、合作热度回落。
基准 AI改善 hit-to-lead、候选物质量与部分患者分层 中高 明显提升 早期提升、后期待证实 中高 平台+合作+部分管线 Tempus、Recursion、Insilico、Generate、AbCellera 低效率 CRO 与手工流程 平台证据仍需持续临床验证。
激进 AI在翻译生物学与临床分层中得到系统验证 快速上升 中高 很高 很高 平台+管线双轮驱动 Isomorphic、Insilico、Iambic、Generate、Tempus 传统发现外包、通用模型卖方 估值泡沫与监管节奏不匹配。

估值框架的结论

  • 软件平台型:优先看 ARR/订阅收入增长、毛利率、净留存、客户数、行业嵌入深度。
  • 平台+合作型:看 upfront 质量、可触发里程碑密度、合作重复率、自研项目推进速度。
  • 管线型 AI-biotech:最终仍回到传统 biotech 的 rNPV,只是平台能否提高成功率会影响成功概率假设。
  • 数据资产型:要看数据是否独占、是否结构化、是否能直接用于药企决策与监管接受。
  • 最不应单独估值的是“基础模型本身”,因为结构预测和通用生成模型正在更快开源和商品化。

细分赛道深度拆解

下表按“赛道逻辑—收入转化—壁垒—风险—投资吸引力”压缩展示。评分为本文研究判断,满分 10 分。

赛道 商业化现状 AI需求如何转化为收入 核心壁垒 主要风险 未来催化 投资吸引力
AI靶点发现 已有药企合作,收入多为合作款 靶点优先级、疾病机制图谱 → 合作研发费/里程碑 多组学+表型+因果推断+验证闭环 假阳性靶点、转化失败 更多可重复 target win 8
多组学AI平台 成熟度提升中 数据订阅、联合研究、分析平台费 数据规模与 annotation 样本标准化困难 更大 pharma adoption 8
单细胞AI平台 偏工具/科研向,但正在商业化 仪器+试剂+分析软件+pharma项目 数据质量与空间分辨率 学术预算波动 空间组学渗透 7
蛋白结构预测 科研价值巨大,利润池有限 主要作为上游能力嵌入下游产品 算法能力 开源与商品化 AF3/RoseTTA 生态应用 5
蛋白设计 进入合作和临床前 stage 合作研发、平台许可、自研蛋白管线 设计 × 可制造性 × wet lab 从序列到药物的鸿沟 更多大药企里程碑 9
抗体设计 商业化最清晰之一 合作里程碑、版税、自研抗体 湿实验、大规模筛选、CMC 竞争拥挤 更多临床进入 9
小分子生成 商业化加速中 合作研发、自研管线、部分软件 化学数据、闭环实验 生成容易、转化难 更多 II 期验证 8
虚拟筛选 已成熟嵌入工具链 软件费、项目制服务 与实验验证耦合 单点功能被压价 更高命中率案例 7
物理模拟/计算化学 最成熟赛道之一 订阅费、席位费、云费 物理模型、客户习惯 客户预算收缩 云交付扩张 9
ADMET预测 落地较强 软件+服务,影响 go/no-go 决策 历史数据、监管可信度 数据偏差 监管接受度提升 8
毒性预测 中早期验证中 项目服务+平台插件 数据稀缺、负样本难 误伤候选物 动物替代监管推动 7
合成路线规划 已有实用化 软件 API、化学工作流 反应数据库 与真实工艺脱节 自动化合成整合 6
自动化实验室 已有真实客户 设备收入+软件+运维 硬件集成与 SOP 部署周期长、重资产 大药企 CAPEX 恢复 8
高通量筛选 成熟但易服务化 项目费、平台合作费 设备和流程 劳务化压价 与主动学习结合 7
Biofoundry 仍偏高端平台 平台接入、联合开发、foundry服务 自动化+工程化 产能利用率 合成生物和蛋白设计扩展 7
AI临床前验证 快速发展 仿真、候选筛选、体外替代模型 数据+模型+实验 外推到人体仍难 FDA 减少动物试验推动 8
AI临床试验设计 已落地 clinical SaaS+服务 历史试验网络与 RWD 销售周期长 更多药企 DCT 预算 9
AI患者招募 已落地 站点筛选和患者匹配服务费 EHR 网络、医院渠道 隐私与接口碎片化 招募效率 case study 8
真实世界数据 高确定性 数据许可+咨询+证据生成 数据独占与治理 合规/主权 外部对照扩大 9
合成对照组 监管接受仍在扩展 研究服务+申报支持 长期纵向数据 适用边界窄 肿瘤/罕病试点 6
药物安全监测 商业化成熟 PV 软件与服务 合规与历史库 替代难但创新慢 生成式写作效率提升 7
医学写作/监管申报 已有显著效率收益 文档自动化软件+服务 合规、审校流程 大模型幻觉 Veeva/合作生态扩张 8
AI药企研发平台 最能复利 行业云/知识平台/agent 订阅 工作流嵌入、验证数据 大药企自建 更大额并购与替换潮 10
研发数据平台 高价值 ELN/LIMS/数据湖/知识图谱 数据结构化和迁移成本 开源基础组件 Siemens-Dotmatics 类交易 10
ELN/LIMS/科研数据管理 已成熟、AI化初期 订阅费、扩容费 黏性极高 创新节奏慢 AI agent 叠加 9
AI制药工艺优化 导入加速 厂内软件、工艺服务 GMP 与生产 know-how 验证周期长 先进制造监管推动 7
AI-native biotech 弹性最大 合作+里程碑+版税+管线 数据+模型+实验+临床 现金消耗、临床失败 II 期/BD/M&A 9
AI+CRO 间接受益 提效后改善交付和毛利 客户与执行网络 价格竞争 DCT/RBQM 普及 6
AI+生命科学工具 真实受益 仪器、耗材、软件升级 installed base 科研预算波动 多组学/自动化渗透 8
AI+云和算力 必需但非专属 云费、训练推理 资本密集 生物专有价值弱 更大模型/模拟需求 6

最容易泡沫化的赛道: 泛生物基础模型、无湿实验闭环的“纯生成”公司、单点结构预测、只卖愿景不披露客户复购和临床进展的 AI-native biotech。

最可能产生真正复利的赛道: 生命科学研发软件平台、临床与真实世界数据、biosimulation、工作流级 AI、自动化实验与数据闭环、蛋白/抗体设计中真正进入临床并保留权益的公司。

投资标的总表与公司分层

精选上市与重要未上市标的总表

注:估值指标优先使用截至 2026-05-19 的市值/股价与已披露 2025 全年收入做粗略口径;部分 EV/EBITDA、现金消耗与研发费用若本文未检索到完整当期口径,标注“需进一步验证”。“受益路径”与“冲击路径”为本文研究判断。

公司 代码/市场 上市状态 细分环节 核心AI平台/产品 AI受益路径或冲击路径 关键验证 已披露财务/估值抓手 判断
Recursion RXRX / Nasdaq 上市 表型组学+小分子 Recursion OS、phenomap、Valence/Exscientia整合 直接受益:平台合作+管线 2025 收入 7468 万美元;Roche/Genentech 累计收款 2.13 亿美元;Sanofi 累计收款 1.34 亿美元;现金约 7.54 亿美元 市值约 15.3 亿美元;P/S 约 20.5x;现金消耗高。 高弹性、高风险
Schrödinger SDGR / Nasdaq 上市 计算化学软件+管线 Maestro、LiveDesign、physics platform 直接受益:软件订阅+合作研发+少量管线 2025 收入 2.56 亿美元,其中软件收入 1.995 亿美元、软件毛利率 74%;与 Lilly 的 TuneLab 集成说明平台已成行业入口。 市值约 8.92 亿美元;P/S 约 3.5x 高确定性平台
Certara CERT / Nasdaq 上市 Biosimulation/PKPD/监管 Simcyp、Phoenix 等 直接受益:软件与服务已深度商用 2025 收入 4.188 亿美元,软件收入 1.833 亿美元,Adj. EBITDA 1.345 亿美元,现金 1.894 亿美元,客户 2600+ 市值约 7.19 亿美元;P/S 约 1.7x 被低估的高质量平台样本
AbCellera ABCL / Nasdaq 上市 抗体发现/蛋白工程 抗体发现平台+自研管线 直接受益但已更像平台+管线 biotech 2025 收入 7513 万美元;已有 104 个 partner-initiated programs、两项自研进入临床;现金及等价物+有价证券约 5.34 亿美元 市值约 12.6 亿美元;P/S 约 16.8x 平台强,临床与商业化仍待证实
Tempus AI TEM / Nasdaq 上市 临床/分子数据平台 AI 诊断+数据与应用 直接受益:诊断、数据服务、试验匹配 2025 收入 12.72 亿美元,同比 83.4%;Q4 收入 3.67 亿美元;扩展到日本 JV。 市值约 78.1 亿美元;P/S 约 6.1x 商业兑现最强的“AI医疗/研发数据”样本之一
Veeva VEEV / NYSE 上市 生命科学行业云 Vault、Veeva AI Agents 平台型直接受益 FY2026 收入 31.95 亿美元,订阅收入 26.84 亿美元;AI Agents 已明确分阶段推出至 Clinical/Regulatory/Medical。 市值约 276.8 亿美元;P/S 约 8.7x 高确定性、估值不便宜
IQVIA IQV / NYSE 上市 RWD+临床试验+CRO IQVIA AI、预测建模、站点选择 平台型直接受益 2025 收入 163.1 亿美元;拥有 12 亿+ 非识别患者记录和 4600+ 数据资产。 市值约 293 亿美元;P/S 约 1.8x 低估值高确定性的临床/RWD平台
Thermo Fisher TMO / NYSE 上市 生命科学工具+临床基础设施 仪器、软件、自动化、Clario/PPD 工具型受益 2025 收入 445.6 亿美元;继续并购 Clario 扩展临床试验数字化。 市值约 1649 亿美元;P/S 约 3.7x 卖铲人龙头
Danaher DHR / NYSE 上市 生物工艺/生命科学工具 Cytiva、Beckman、IDBS 生态 工具型受益 2025 全年表现稳健,Q4 收入 68 亿美元 市值约 1165 亿美元;全年 EV/S 需进一步验证。 卖铲人,AI财务弹性间接
Illumina ILMN / Nasdaq 上市 测序基础设施 NGS 平台 工具型间接受益 2025 Q4 收入 11.6 亿美元;多组学与精准医学基础层。 市值约 217.9 亿美元 数据层重要,但 AI 直接变现弱于软件平台
10x Genomics TXG / Nasdaq 上市 单细胞/空间组学 Chromium、Visium、Xenium 生态 工具型间接受益 2025 收入 6.428 亿美元;空间组学是靶点和机制建模的重要数据基础。 市值约 27.5 亿美元;P/S 约 4.3x 中长期数据卖铲人
Siemens + Dotmatics SIE / 德国 上市+并购资产 研发软件平台 Dotmatics/Luma 平台型受益 Siemens 以 51 亿美元 EV 收购 Dotmatics;Dotmatics 2025 收入预计 3 亿+美元,Adj. EBITDA margin 40%+ 交易本身就是估值锚 研发软件层并购验证
Generate:Biomedicines GENB / Nasdaq 上市 AI蛋白设计+管线 Generate Platform AI-native biotech 与 Novartis 合作总潜在价值 10 亿+美元,upfront 6500 万美元;IPO 融资 4 亿美元 市值约 8.44 亿美元 值得跟踪,但临床验证仍早
Isomorphic Labs 未披露 / 英国 未上市 蛋白结构+小分子设计 IsoDDE/AlphaFold衍生能力 AI-native biotech Lilly/Novartis 合作总潜在价值接近 30 亿美元;2026 年融资 21 亿美元 估值未披露 私募龙头,临床前到临床过渡期
Insilico Medicine 3696.HK / 港股 上市 小分子AI+管线 Pharma.AI AI-native biotech 2025 软件合作进入全球前 20 大药企中的 13 家;与 Lilly 新合作 upfront 1.15 亿美元、总价值最高 27.5 亿美元;2025 完成港股 IPO。 估值需进一步验证 中国/全球 AI-biotech 核心样本
Iambic Therapeutics 未披露 / 美国 未上市 小分子AI AI平台+候选药物 AI-native biotech 2025 新融资 1 亿+美元,并与 Takeda 合作。 未披露 值得重点跟踪
Xaira Therapeutics 未披露 / 美国 未上市 端到端AI-biotech Virtual cell + therapeutics AI-native biotech 2024 启动资金 10 亿+美元 未披露 一级市场顶级阵容,但收入与临床远期
Cradle 未披露 / 荷兰/瑞士 未上市 AI蛋白工程软件 Protein engineering copilot 平台型受益 2024/2025 Series B 7300 万美元,总融资 1 亿+美元,已有 top pharma 使用。 未披露 蛋白设计软件化样本
Benchling 未披露 / 美国 未上市 研发操作系统 ELN/LIMS/R&D Cloud 平台型受益 覆盖 20万+ 科学家、全球前 50 大 biopharma 中超过一半;2021 估值 61 亿美元 估值高,财务未披露 长期核心基础设施
BenchSci 未披露 / 加拿大 未上市 疾病生物学AI ASCEND、BEKG 平台型受益 使用于 16/20 顶级药企;2025 与 Sanofi、Thermo、Merck 合作;2023 融资 9500 万美元 未披露 Preclinical AI 的优质软件标的
Opentrons 未披露 / 美国 未上市 自动化实验室 OT-2/Flex 工具型受益 AI-enabled lab automation,面向实验室自动化。 未披露 自动化普及受益,但需看企业付费能力
WuXi AppTec 603259.SH / 2359.HK 上市 CRO/CDMO 一体化新药研发与生产平台 间接受益:AI 提升发现与新分子服务效率 2025 收入 454.6 亿元,在手订单 580 亿元,新分子业务占比超 30% A/H 估值需进一步验证 中国链条中最值得跟踪的间接受益者
Tigermed 300347.SZ / 3347.HK 上市 临床 CRO/DCT/PV CTRM、DCT、AI 翻译与 PV 间接受益 已上线“医学智问”“医雅智能翻译平台”,并推进 RBQM、DCT。 估值需进一步验证 AI 临床工具受益者
BGI Genomics 300676.SZ 上市 多组学/检测 多组学大数据 间接受益 2025H1 单细胞相关业务增速显著,多组学大数据覆盖 100+ 国家。 估值需进一步验证 数据层受益,但AI货币化仍间接

公司分层与投资优先级

A类:AI药物研发核心直接受益者 Veeva、IQVIA、Certara、Schrödinger、Tempus、Benchling、Dotmatics/Siemens。 理由:要么已经形成清晰的订阅/平台收入,要么掌握高价值临床/研发数据网络,要么已嵌入药企核心工作流。

B类:明显受益,但存在估值、临床或商业化风险 Recursion、AbCellera、Generate、Insilico、Iambic、10x Genomics、WuXi AppTec。 理由:平台很强,但或因现金消耗高、或因临床验证不足、或因收入仍波动。

C类:AI主要用于提效,短期财务弹性不强 Thermo Fisher、Danaher、Illumina、Tigermed、BGI Genomics。 理由:AI 是增强器而非主要收入来源,收益更偏间接。

D类:叙事强但实际受益证据仍不足 部分泛基础模型公司、纯靶点发现公司、以及尚无重复药企合作/无临床推进/无收入披露的早期 AI-biotech。 理由:模型能力尚未转化为稳定收入或临床价值。

E类:可能被AI与自动化压缩的传统环节 低自动化、低数据沉淀、低技术含量的人工发现外包和文档/翻译/监查流程。 理由:AI 和自动化首先替代的是标准化、重复性、低差异化流程。

评分模型与重点公司排名

正向评分模型

  • AI药物研发收入或管线价值直接暴露度:20%
  • 数据、模型和实验闭环壁垒:20%
  • 药企合作和客户质量:15%
  • 管线质量和临床验证:15%
  • 财务质量和现金 runway:10%
  • 市场空间和成长弹性:10%
  • 估值合理性:10%

反向风险模型

  • 临床验证不足:25%
  • 收入持续性不足:20%
  • 现金消耗和融资风险:20%
  • 平台有效性尚未证明:15%
  • 药企自建或开源替代风险:10%
  • 估值过高:10%
公司 正向总分 商业化风险分 简评
Veeva 84 18 工作流和合规层最稳的 AI 受益者之一。
IQVIA 82 22 临床/RWD 数据网络强,估值反而不极端。
Certara 81 24 biosimulation 商业模式最清楚,监管友好。
Tempus 79 37 数据资产稀缺,增长强,但估值与整合执行需验证。
Schrödinger 77 33 软件真实性强,平台价值高于短期管线。
Thermo Fisher 74 20 工具卖铲人,AI是加分项而非主故事。
Dotmatics/Siemens 73 21 并购已验证研发软件资产价值。
Recursion 72 61 平台和合作强,但现金消耗和临床不确定性高。
10x Genomics 70 35 单细胞/空间组学长期价值高,短期财务波动。
WuXi AppTec 69 28 中国链条中 AI 间接受益最清晰。
AbCellera 67 58 抗体平台优质,但收入与临床验证尚不足。
Generate 66 56 蛋白设计赛道龙头之一,仍需临床和收入连续性。
Insilico 65 57 BD 非常强,但二级市场更需要持续临床与收入兑现。
Illumina 64 32 数据基础价值强,但AI直接变现间接受益。
Tigermed 60 34 DCT/PV/AI翻译带来提效,弹性偏运营改善。

重点上市公司深度分析

为控制篇幅,以下按“最值得进一步研究的上市样本”压缩呈现,重点覆盖直接暴露、平台壁垒、收入验证、估值与风险。

公司 所属赛道 核心AI产品/平台/管线 商业化阶段 药企合作/客户/临床验证 AI对收入与利润影响 数据/模型/实验/客户壁垒 估值与财务观察 未来催化剂 研究结论
Recursion 表型+生成+平台+管线 Recursion OS、phenomap、自研管线 平台+管线混合 Roche/Genentech、Sanofi;合作款已兑现;管线推进中。 当前收入仍主要来自合作,不是软件 ARR;亏损大。 数据、CRISPR 表型图谱强;实验闭环强;客户壁垒中高。 市销率高、现金多但 burn 高。 更多里程碑、管线临床更新、Exscientia整合协同。 高弹性/高风险/值得继续跟踪
Schrödinger 计算化学软件 Maestro、LiveDesign、physics platform 已成熟软件 + 管线可选 软件客户广泛;与 Lilly TuneLab 集成强化平台位势。 软件收入接近 2 亿美元且毛利高,利润率受管线投入拖累。 算法、工作流与客户习惯强;实验闭环弱于 wet-lab 平台。 市值已回落,P/S 低于很多AI-biotech。 软件 ACV 恢复、合作收入、管线读数。 高确定性平台/值得深入研究
Certara Biosimulation/监管 Simcyp、Phoenix 等 已完全商用 2600+ 客户、监管场景深。 AI主要增强存量平台,收入稳定性较强。 监管接受度、历史数据库、专业服务壁垒高。 相对低 P/S、正 EBITDA、现金充足。 软件恢复增长、新产品 adoption。 高确定性/估值相对合理
AbCellera 抗体发现+自研 抗体平台、自研 ABCL635/575/688/386 平台向临床 biotech 过渡 104 个 partner programs,两项资产在临床。 历史合作收入波动大,自研投入提升亏损。 数据+湿实验+制造平台强。 现金和证券约 5.34 亿美元,可支持较长 runway。 ABCL635/575 数据、更多 partner 里程碑。 平台强/临床与商业化需持续验证
Tempus AI 临床数据/精准医学 数据与应用平台、AI诊断 商业化强 诊断、pharma、应用三位一体;医院网络与日本 JV。 AI 已直接拉动收入规模,但利润仍在改善期。 临床-分子数据和工作流壁垒极强。 快速增长对应较高估值,但并非极端。 数据业务增长质量、盈利转正路径。 高成长/估值需消化/值得重点研究
Veeva 研发与合规行业云 Veeva AI Agents、Vault 高成熟度 深度嵌入生命科学工作流。 AI 更可能提升 ARPU 和客户粘性,而非单独新赛道。 行业流程与合规壁垒极高。 高质量 SaaS,估值不便宜但可理解。 AI Agents 推广速度,Clinical Data 上线。 A类平台赢家
IQVIA 临床/真实世界数据/CRO IQVIA AI、RWD、站点选择 高成熟度 数据、CRO 与分析网络全球化。 AI提升交付效率和客户价值,短期财务弹性稳健。 数据与执行网络壁垒极高。 估值相对温和。 药企 DCT/RWE 预算增加。 A类、高确定性、被低估的AI受益者
Thermo Fisher tools + clinical infra 仪器、自动化、PPD/Clario 高成熟度 通过并购扩展临床与数字化。 AI是需求增强器,不是主收入来源。 installed base、耗材和交叉销售强。 大型卖铲人,PS 不极端。 Clario 整合与自动化渗透。 工具型受益者
Danaher tools/生物工艺 Cytiva/Beckman/软件资产 高成熟度 生命科学与生物制药基础设施。 更多体现为研发与生产提效。 工艺与客户锁定强。 更偏防御型受益。 生物工艺与实验自动化需求恢复。 间接受益/长期配置型研究对象
Illumina NGS 数据基础设施 Sequencing platforms 成熟 精准医学和多组学底座。 AI 主要刺激下游应用需求。 数据/生态高,但定价和地缘风险存在。 更像基础设施,而非AI直接收益。 新平台渗透、政策环境。 C类,值得跟踪但非首选AI纯受益
10x Genomics 单细胞/空间组学 Chromium/Visium/Xenium 中成熟 高价值科研数据源。 AI 需求传导到高质量组学数据需求。 单细胞/空间数据壁垒高。 财务弹性受科研预算影响。 空间生物学 adoption。 卖铲人中的高弹性标的
Siemens R&D 软件平台 Dotmatics/Luma 并购后整合 以 51 亿美元验证生命科学软件价值。 直接受益于研发软件平台扩张。 软件平台+多模态数据壁垒高。 收购价格本身是估值坐标。 整合与交叉销售。 关注软件平台并购逻辑
Generate:Biomedicines AI蛋白设计 Generate Platform、GB-0895 等 临床化早期 Novartis、Amgen 合作;已上市。 当前合作价值较高,自研临床更决定估值。 蛋白生成+湿实验+管线。 IPO 后波动大,需看临床。 III 期推进。 高弹性/高风险/值得继续跟踪
Insilico Medicine AI小分子+管线 Pharma.AI、ISM 系列 商业化与临床并进 Lilly、Sanofi、Exelixis、Menarini 等。 软件/合作/管线三重结构,兑现度高于多数 private peers。 端到端平台、BD 能力强。 作为港股 AI-biotech 样本重要。 更多临床数据、合作落地。 AI-native biotech 核心研究对象
WuXi AppTec 一体化 CRO/CDMO 新药发现到生产平台 商业化强 订单和新分子业务增长。 AI 反映在提效和客户获取,不是独立收入项。 一体化执行能力。 中国链条中估值与政策因素并存。 国际项目恢复、AI服务升级。 中国间接受益核心样本
Tigermed 临床 CRO/DCT DCT、CTRM、AI翻译/PV 商业化 DCT 和临床技术服务已上线销售。 AI 提效利于毛利率与交付。 医院网络与执行能力。 直接AI弹性较弱。 DCT 项目放量。 中国临床AI受益者,但更偏运营改善

风险、预期差与最终结论

哪些公司已经充分反映 AI 预期。 从当前市场叙事与估值结构看,Recursion、AbCellera、部分高热度 AI-native biotech、以及仍未形成稳定收入的泛模型公司,更容易出现“平台价值提前资本化”的情况;同时,若未来临床兑现不及预期,估值会更脆弱。相反,Certara、IQVIA、部分生命科学研发软件资产在二级市场上反而没有完全反映 AI 作为提效与扩品类引擎的潜力。

哪些公司仍可能存在预期差。

  • Certara:最被低估的原因在于市场仍把它看成“专业软件+服务”,而不是药物研发中 AI+监管接受度最高的决策平台之一。
  • IQVIA:其 RWD + CRO + AI 的组合,比多数“单点AI公司”更接近大药企预算中心。
  • Schrödinger:市场对其管线波动更敏感,容易低估其软件平台的行业入口属性。
  • Veeva:外界容易把它视为传统 SaaS,但生命科学行业专有 AI agent 的嵌入深度可能让它持续拿到增量预算。
  • 10x Genomics:如果空间/单细胞数据成为 AI 靶点发现和患者分层的“新底座”,其数据基础设施价值会被重估。

哪些传统公司最可能受益。 Thermo Fisher、Danaher、Illumina、10x、IQVIA、Veeva、WuXi AppTec、Tigermed。这些公司不是因为“自己会做最好的模型”而受益,而是因为 AI 会增加对高质量数据、自动化、合规工作流、临床执行网络、组学基础设施和研发软件的需求。

哪些传统公司可能被冲击。 最可能承压的是: 一、依赖大量人工筛选、人工文档、人工监查的低技术服务; 二、没有自有数据和软件控制权的发现外包; 三、缺乏自动化能力的低端实验流程。 AI 不必取代全部 CRO 才能压缩其利润池;只要提高药企内部与龙头平台的研发效率,就会改变价格权。

系统性风险清单。

  • 商业化低于预期:客户把 AI 当试点而非核心采购。
  • 临床失败:平台提高早期效率,但并未改善人体转化。
  • 平台有效性无法证明:只能讲个案,不能批量复制。
  • 收入持续性不足:合作收入高度依赖 milestone。
  • 现金消耗和再融资风险:尤其是平台+管线混合模式。
  • 大药企自建与开源替代风险:尤其是结构预测和通用模型层。
  • 数据偏差与数据主权风险:RWD、EHR、跨境数据使用约束。
  • 自动化实验 CAPEX 重、落地慢。
  • 监管不确定性:AI 进入组织级 GxP 与申报仍需更多标准化。

最终结论

AI药物研发与生命科学平台在 AI 产业链中的重要性,不在于它会最先诞生多少“明星药”,而在于它是少数能够把 AI 真正嵌入高毛利、强监管、长周期、重决策流程的行业场景之一。它比多数通用 AI 应用更慢,但一旦进入核心工作流,粘性更强、迁移成本更高。

最值得关注的五个细分赛道

  • 生命科学研发软件与行业云
  • 临床数据/RWD/患者招募平台
  • Biosimulation 与计算化学
  • 蛋白/抗体设计中带湿实验闭环的平台
  • 自动化实验室与研发数据基础设施。

最值得深入研究的十家上市公司 Veeva、IQVIA、Certara、Schrödinger、Tempus、Recursion、Thermo Fisher、Danaher、10x Genomics、WuXi AppTec。

最值得跟踪的十家未上市/一级市场公司 Isomorphic Labs、Iambic、Xaira、Cradle、Benchling、BenchSci、BigHat、PathAI、EvolutionaryScale、Profluent。

最容易被市场误解的五个点

  • AlphaFold/基础模型突破,不等于利润池会留在模型层。
  • AI 缩短前期 discovery 时间,不等于会同步缩短审批和上市时间。
  • 几十亿美元合作 headline 不等于真实收入。
  • “平台公司”如果没有经常性收入和客户嵌入,最后可能只是高估值 biotech。
  • 数据资产和实验闭环,通常比模型本身更重要。

未来 6—12 个月最该跟踪的指标

  • AI-native biotech 的 II 期/关键 PoC 数据
  • 大药企合作中新触发的近端里程碑与追加合作
  • 软件平台的 ARR、软件收入增速、客户留存和大型客户扩张
  • 研发数据平台/自动化平台的大额并购
  • 现金余额、净现金消耗、隐含 runway。

平台型赢家 Veeva、IQVIA、Certara、Schrödinger、Benchling、Dotmatics/Siemens、Tempus。 AI-native biotech 挑战者 Isomorphic、Insilico、Recursion、Generate、Iambic、Xaira、AbCellera。 卖铲人 Thermo Fisher、Danaher、10x、Illumina、Opentrons、WuXi AppTec。 伪受益或高风险画像 只会展示模型能力、没有复购客户/没有临床推进/没有数据闭环/没有收入质量披露的公司。

开放问题与局限 本文已尽量优先使用截至 2026-05-19 的公开资料,但仍有若干信息未完全披露或需进一步验证:

  • 多数未上市公司缺少可核验 ARR、毛利率与现金消耗;
  • 部分欧洲、日本、韩国、印度公司的 AI 药研收入贡献未单独披露;
  • 若要做下一步更窄更深的研究,我建议优先收缩到以下任一方向:

AI蛋白设计、AI小分子发现、自动化实验室、AI临床试验、AI+CRO、AI药企研发平台、多组学AI、AI-native biotech 估值

AI 药物研发biosimulation计算化学临床试验RWD生命科学平台AlphaFold研发 IT