L3 AI 工厂 / 云基础设施

AI中间件与MLOps

当前核心信号:AI应用落地需要向量检索、模型管理和算力调度中间层,但向量能力被主流数据库内置,大厂平台化压缩独立工具护城河

一句话判断

AI中间件与MLOps 是 L3 AI 工厂 / 云基础设施中连接上游供给、产业约束和下游 AI 需求的关键环节,当前主要观察 AI应用落地需要向量检索、模型管理和算力调度中间层,但向量能力被主流数据库内置,大厂平台化压缩独立工具护城河。

关键瓶颈 AI应用落地需要向量检索、模型管理和算力调度中间层,但向量能力被主流数据库内置,大厂平台化压缩独立工具护城河
代表公司 4 家
内容状态 部分填充

核心约束

先看卡点
AI应用落地需要向量检索、模型管理和算力调度中间层,但向量能力被主流数据库内置,大厂平台化压缩独立工具护城河

后续会补充关键瓶颈、资本开支信号和催化事件。

代表公司

4 家

近期催化

待补充

相关催化待补充

研究笔记

来自 Obsidian

AI中间件与MLOps

AI 中间件与 MLOps 产业视觉图

关键信息摘要

Key Highlights

  • 向量数据库全球市场2025年约26.5亿美元,CAGR 22-28%,2030年预计达89.5亿美元;MLOps市场2025年约22-36亿美元,CAGR 37-42%;中国智能算力市场2024年约190亿美元,同比增长86.9%(IDC)
  • 关键并购:CoreWeave以约17亿美元收购W&B(2025.3),Databricks以约10亿美元收购Neon(2025),JFrog收购Qwak AI(2025);Pinecone 2025年下半年探索出售(竞争加剧信号)
  • 结构性风险:向量搜索正在被PostgreSQL pgvector、MongoDB、Elasticsearch等主流数据库内置,纯向量数据库独立护城河面临侵蚀
维度 内容
向量数据库全球市场规模 2025年约25-27亿美元(MarketsandMarkets / GM Insights)
MLOps全球市场规模 2025年约22-36亿美元(Fortune Business Insights / Grand View Research)
中国智能算力市场规模 2024年约190亿美元,同比增长86.9%(IDC)
核心参与者数量 13家(树状图原有);调研补充5家
年复合增长率 向量数据库22-28%;MLOps 37-42%;中国智算市场40%+(2024-2030)
报告数据截止日 2026年2月24日

行业定义与边界

AI原生中间件与开发平台是指位于底层算力基础设施(云/GPU集群)与上层AI模型/应用之间的技术中间层,为AI全生命周期(数据管理、模型训练、实验追踪、模型部署、推理监控、算力调度)提供开发工具、数据服务与编排能力。

本子行业涵盖三大细分赛道:

  • 向量数据库:专为AI嵌入向量(Embedding)存储与相似性检索设计的数据库系统,是RAG(检索增强生成)和语义搜索的基础设施
  • MLOps / AI开发平台:覆盖数据处理、特征工程、模型训练、实验管理、模型部署、监控运维全流程的平台与工具
  • 算力调度与算力网络:实现跨地域、跨架构(GPU/NPU/CPU)算力资源的统一纳管、智能编排与按需分配

与相邻子行业的区分:

  • 与"云计算与智算平台"的区别:云平台提供底层IaaS/GPU实例,本子行业在其上构建AI专用的软件工具层
  • 与"AI算力租赁"的区别:算力租赁侧重物理资源的转租与运营,本子行业的算力调度侧重软件定义的资源编排与优化

细分格局:

细分市场 代表厂商 市场特征
向量数据库(开源) Milvus/Zilliz、Weaviate、Qdrant、Chroma 开源驱动,社区活跃,商业化仍在探索
向量数据库(闭源/托管) Pinecone 全托管SaaS,易用性强,但面临大厂功能集成压力
MLOps平台(海外) Databricks、Datadog、Hugging Face、W&B(已被CoreWeave收购) 技术领先,生态成熟,估值/营收规模大
MLOps/AI平台(中国) 第四范式、星环科技、百度飞桨 聚焦行业场景,面临盈利压力
算力调度(中国) 中科曙光、青云科技、优刻得、并行科技 政策驱动,与"东数西算"深度绑定

市场规模与增长

向量数据库市场: MarketsandMarkets预测,2025年全球向量数据库市场规模约26.5亿美元,预计到2030年达到89.5亿美元,CAGR约27.5%。GM Insights给出2025年约25.5亿美元的估计,2026-2034年CAGR约22.3%。

市场驱动力:(1)RAG架构成为LLM应用标配,向量检索需求爆发;(2)多模态AI(图像、音频、视频嵌入)拓展向量数据库应用场景;(3)Gartner预测2026年30%的企业应用将使用向量数据库。

结构性风险:向量搜索正在被主流云数据库(PostgreSQL pgvector、MongoDB Atlas Vector Search、Elasticsearch)集成为内置功能,纯向量数据库的独立护城河面临侵蚀。

MLOps市场: Fortune Business Insights预测2025年全球MLOps市场约23.3亿美元,到2034年达259亿美元,CAGR约28.9%。Grand View Research给出更高估计:2025年约30.3亿美元,到2030年达166亿美元,CAGR约40.5%。

驱动因素:(1)2025年全球超过78%的大型企业已将ML模型部署至生产环境;(2)AI Agent与多模型编排推动MLOps从"模型管理"向"Agent运维"进化;(3)合规与可解释性要求推动模型监控需求。

中国算力调度与智算市场: IDC与浪潮信息联合报告显示,2024年中国智能算力规模达725.3 EFLOPS,同比增长74.1%,市场规模约190亿美元,同比增长86.9%。工信部目标2025年算力规模超300 EFLOPS,智能算力占比达35%。"东数西算"工程加速全国一体化算力网络建设,算力调度软件成为刚需。

技术演进路线

技术路线
阶段 01
上游环节
阶段 02
中游环节
阶段 03
下游环节
原始图谱
flowchart LR
  上游环节 --> 中游环节 --> 下游环节

技术演进阶段:

  • 2023-2024:向量数据库独立赛道爆发,MLOps从实验管理向全生命周期延伸
  • 2025-2026:AI中间件全栈整合(算力+数据+模型+Agent编排),传统中间件"微服务+关系数据库"被"Agent+向量数据库+语义检索"替代
  • 2027+:AI原生操作系统化,算力调度、模型管理、Agent编排融合为统一平台

核心技术栈:

  • 向量数据库:近似最近邻搜索(HNSW、IVF、量化压缩)、混合搜索(向量+关键词+元数据)、分布式架构(存算分离、水平扩展)
  • MLOps:实验管理(超参数追踪、模型版本控制)、模型部署与服务化(ONNX/TensorRT、A/B测试)、模型监控(数据漂移检测、推理延迟监控)
  • 算力调度:异构资源池化、智能编排(基于任务特征自动匹配最优算力)、跨地域调度(支持"东数西算"场景)

产业价值链结构

价值链
上游 原材料
中游 制造
终端 客户
原始图谱
flowchart LR
  原材料 --> 制造 --> 客户

重点公司

本土龙头

  • 第四范式6682.HK)— 中国纯AI商业模式营收最大的公司;2024年全年总收入52.61亿元(同比增长25.1%),核心先知AI平台收入36.76亿元(同比增长46.7%);2025上半年经调整净亏损仅4,370万元,接近盈亏平衡;市值约318亿港元(2026年2月)
  • 中科曙光603019.SH)— 超算领域绝对龙头;"立体计算"战略,构建多维异构算力架构;参与七省智算中心建设;2024年全年营收131.48亿元;液冷技术领先(单机柜散热100kW)
  • 优刻得 UCloud688158.SH)— A股稀缺独立公有云+AI算力调度标的;管理AI算力规模约3,000P+;2025上半年AI收入占比达31.54%,毛利率从18.4%提升至25.0%;亏损持续收窄

海外对标

  • Databricks(未上市,预计2026年IPO)— 全球最大统一数据+AI平台;2025年12月完成50亿美元融资,估值达1,340亿美元;年化收入超54亿美元,同比增长65%;已收购MosaicML(13亿美元)、Tabular(10亿美元)、Neon(10亿美元)
  • Datadog(DDOG)— 全球领先云可观测性平台;2025财年全年收入34.3亿美元,同比增长28%;超5,500家客户使用Datadog AI集成;48%的财富500强为其客户
  • Hugging Face(未上市)— AI开源社区的"GitHub";估值45亿美元;超500万用户,托管超100万个模型;Google、Amazon、NVIDIA等均为投资方
  • Weights & Biases(已被CoreWeave以约17亿美元收购)— MLOps平台,超1,400家企业客户包括OpenAI、Meta、NVIDIA;CoreWeave通过此次收购实现"GPU云+MLOps平台"的全栈整合

未升格公司清单

留作行业全景参考,未单独建 note。出现重大催化时考虑升格。

  • 星环科技688031.SH)— 科创板大数据/AI基础软件,2024年营收3.72亿元(同比下降24.3%),持续亏损;2025年8月向港交所递交H股上市申请
  • 青云科技688316.SH)— 独立云平台+AI算力调度标的,市值约29亿元,净资产仅8,711万元,经营风险较高
  • 并行科技920493.BJ)— 2025年前三季度智算云收入同比增长151.1%;"并行算网"布局"东数西算";2025年内涨幅一度达288%
  • Zilliz / Milvus(未上市)— 全球最大开源向量数据库Milvus的商业化公司;GitHub Stars 40,000+,10,000+企业客户;技术全球领先,总部已迁至旧金山
  • Pinecone(未上市)— 全托管Serverless向量数据库,2025年下半年探索出售(前估值7.5亿美元);竞争格局恶化的标志性信号
  • Weaviate(未上市)— 混合搜索原生支持能力突出;2025年10月完成5,000万美元C轮融资,估值2亿美元
  • Qdrant(未上市)— 德国柏林开源向量数据库,Rust语言开发,2025年引入非对称量化技术实现24倍压缩
  • 百度飞桨 PaddlePaddle — 国内深度学习平台综合份额第一,2,333万开发者,76万家企业;百度集团内部战略资产,不可独立交易

景气度判断

当前景气度(描述性) 信号源:

风险提示

关键风险

  • 向量数据库"功能化"危机:向量搜索被PostgreSQL pgvector、MongoDB等主流数据库内置,独立向量数据库厂商(Pinecone、Zilliz等)护城河受侵蚀,Pinecone 2025年下半年探索出售即为标志性事件
  • 中国AI平台分化加剧:强者恒强,缺乏规模效应的中小厂商(星环科技、青云科技等)面临生存压力,星环科技连续7年亏损且营收持续萎缩
  • 算力调度标的估值波动极大:并行科技等北交所标的2025年内股价波动超200%,存在"炒概念"风险,业绩验证周期长
  • 大厂平台化竞争:阿里云、华为云等加速推出AI中间件集成产品,对独立MLOps和算力调度厂商形成降维打击