L3 AI 工厂 / 云基础设施

AI存储系统

当前核心信号:澜起科技 DDR5+CXL 互连芯片 +94%(Q1 2026)

一句话判断

AI存储系统 是 L3 AI 工厂 / 云基础设施中连接上游供给、产业约束和下游 AI 需求的关键环节,当前主要观察 存储 IO 瓶颈匹配 GPU + 介质升级(QLC NAND/CXL)+ 软件栈。

关键瓶颈 存储 IO 瓶颈匹配 GPU + 介质升级(QLC NAND/CXL)+ 软件栈
代表公司 3 家
内容状态 已完成

核心约束

先看卡点
存储 IO 瓶颈匹配 GPU + 介质升级(QLC NAND/CXL)+ 软件栈

澜起科技 DDR5+CXL 互连芯片 +94%(Q1 2026) · 2026-04-28

代表公司

3 家

近期催化

1 条

研究笔记

来自 Obsidian

AI 存储系统

关键信息摘要

Key Highlights

维度 核心内容
子行业定位 AI 集群的"高速 IO 系统"——存放训练数据集 + 模型 checkpoint + 推理 KV 缓存
商业模式 存储设备 + 存储软件(文件系统/对象存储)+ 增值服务;按 TB/PB 计价或一次性卖
市场规模 2026 年全球 AI 存储 ~250 亿美元;中国 AI 存储 ~400 亿元
关键指标 单卡读写带宽(GB/s)/ 存储 + GPU 比(建议 1:5)/ 全闪存渗透率(>70% 视为高端)
重点公司(A 股) 澜起科技(内存接口/CXL)、江波龙 / 佰维(企业级 SSD)、深科技 / 朗科
海外对标 Pure Storage(全闪存龙头)、NetApp(混合型)、Vast Data(私营,AI 存储新势力)
政策环境 国产存储替代 / 自主可控存储栈 / 数据安全合规
风险因素 内存价格周期波动 / 与 GPU 厂商的接口标准之争 / 大客户内化(OpenAI 自研存储)

行业定义与边界

AI 存储系统是与 GPU 集群匹配的高速 IO 系统。核心问题:单台 H100 服务器训练时每秒需要 30-100 GB 数据喂入,传统 HDD(150 MB/s)+ SATA SSD(500 MB/s)远远不够。

  1. NVMe SSD 单盘:单盘性能 5-15 GB/s,AI 集群标配
  2. 全闪存阵列(AFA):多盘聚合,提供 PB 级容量 + 100+ GB/s 吞吐;Pure Storage / NetApp / 华为 OceanStor
  3. 分布式并行文件系统:Lustre / GPFS / WekaFS / DAOS——大规模 AI 集群必备
  4. CXL 内存池化:跨服务器共享内存,缓解 GPU 内存不足;澜起 CXL 芯片是关键
  5. 对象存储:训练数据集存储;MinIO / Ceph / AWS S3

与 L2-07 存储 HBM/DDR5/NAND 的区别:L2-07 是"存储芯片层"(HBM 颗粒 / NAND 颗粒),L3-08 是"存储系统层"(用这些芯片组装的设备)。L3-08 的玩家从 L2-07 采购颗粒。

与 L3-04 IDC 区别:IDC 卖空间 + 电力,存储系统卖盘 + 文件系统软件。但许多 IDC 厂商提供存储增值服务。

市场规模与增长

  • 2026 年规模 ~250 亿美元,同比 +35%;2024-2029 年 CAGR 28-32%

  • 主要拐点:从"AI 训练存储"扩展到"AI 推理 KV 缓存存储",后者 2025 年起爆发

  • 2026 年规模 ~400 亿元,同比 +40%

  • 国产替代率:企业级 SSD ~50%,AFA ~30%,并行文件系统 ~40%(华为 / 浪潮 / 曙光)

  • 单 GPU 读写带宽要求:H100 推荐 30 GB/s,B200 推荐 50 GB/s,Rubin 推荐 80+ GB/s

  • 存储 GPU 比:训练集群推荐 1 GPU : 5 TB 高速存储(不含数据集)

  • 全闪存渗透率:通用 IDC ~30%,AI 智算 IDC ~75%

澜起科技 CXL 信号(2026Q1):

  • 互连类芯片营收 14.17 亿元同比 +24.4%
  • MRCD/MDB/PCIe Retimer/CKD/CXL MXC 合计 2.69 亿元 同比 +93.8%
  • CXL MXC 卡位 AI 推理 KV 缓存内存池化

技术演进路线

技术路线
阶段 01
HDD机械硬盘
阶段 02
SATA_SSD 带宽不足
阶段 03
NVMe_SSD 带宽300x
阶段 04
全闪存阵列AFA 聚合扩容
阶段 05
并行文件系统PFS 分布式扩展
阶段 06
CXL内存池化 跨服务器共享
AI训练数据集
阶段 07
AI推理KV缓存
原始图谱
flowchart LR
  HDD机械硬盘 -->|带宽不足| SATA_SSD
  SATA_SSD -->|带宽300x| NVMe_SSD
  NVMe_SSD -->|聚合扩容| 全闪存阵列AFA
  全闪存阵列AFA -->|分布式扩展| 并行文件系统PFS
  并行文件系统PFS -->|跨服务器共享| CXL内存池化
  CXL内存池化 --> AI推理KV缓存
  并行文件系统PFS --> AI训练数据集
  1. NVMe 全闪化:传统机械硬盘逐步退出 AI 集群,全闪存渗透率 2026 年破 70%
  2. CXL 内存池化:跨服务器共享内存(CXL 3.0),打破单机内存物理限制;澜起 CXL MXC 是关键芯片
  3. 并行文件系统软件栈:Lustre/GPFS 等老牌 + WekaFS/DAOS 等新势力,竞争激烈
  4. 国产替代浪潮:华为 OceanStor / 浪潮 AS18000 / 曙光 ParaStor 等国产 AFA 加速渗透

产业价值链结构

价值链
上游 NAND 颗粒

三星/海力士/长江存储

中游 企业级 SSD

江波龙/佰维/Solidigm

下游 内存接口芯片

澜起 CXL/MXC

下游 内存模组与内存池化设备
下游 全闪存阵列 AFA

Pure/NetApp/华为 OceanStor

下游 并行文件系统

WekaFS/Lustre/DAOS

下游 AI 训练集群

数据 IO 喂入 GPU

终端 AI 推理集群

KV 缓存

原始图谱
flowchart LR
  A[NAND 颗粒<br/>三星/海力士/长江存储] --> B[企业级 SSD<br/>江波龙/佰维/Solidigm]
  C[内存接口芯片<br/>澜起 CXL/MXC] --> D[内存模组与内存池化设备]
  B --> E[全闪存阵列 AFA<br/>Pure/NetApp/华为 OceanStor]
  D --> E
  E --> F[并行文件系统<br/>WekaFS/Lustre/DAOS]
  F --> G[AI 训练集群<br/>数据 IO 喂入 GPU]
  F --> H[AI 推理集群<br/>KV 缓存]

成本构成:NAND/内存颗粒 50-60% / 控制器芯片 + 接口 15-20% / 软件研发 + 集成 15-20% / 销售 5-10%

毛利率:全闪存阵列 30-45%(Pure 41%)/ NVMe SSD 20-30% / CXL 接口芯片(澜起)70%+

重点公司

本土龙头

  • 澜起科技(688008.SH:内存接口 + CXL 互连领军者;2026Q1 营收 14.61 亿元同比 +20%、归母 +61%;DDR5 RCD 芯片量价齐升,MRCD/MDB/PCIe Retimer/CKD/CXL MXC 合计同比 +93.8%;毛利率 69.8% 同比 +9.3pct;CXL MXC 卡位 AI 推理 KV 缓存内存池化关键节点

海外对标

  • Pure Storage(PSTG.US:全闪存阵列龙头,2025 年营收 ~30 亿美元同比 +13%;DirectFlash 技术性能 + 容量优势;与 NVIDIA 深度合作"AI Factory"参考架构;毛利率 ~70%
  • NetApp(NTAP.US:混合存储龙头,2025 年营收 ~63 亿美元;ONTAP 软件栈业界经典;AI 业务增速放缓但稳定;与 NVIDIA 协同 OnTAP for AI 解决方案

未升格公司清单

  • 江波龙(301308.SZ:企业级 SSD(已在 L2-07 列)
  • 佰维存储(688525.SH:嵌入式 + 企业级 SSD(已在 L2-07 列)
  • 深科技(000021.SZ:存储产品 OEM
  • 朗科科技(300042.SZ:消费级存储为主
  • 华为 OceanStor(未上市):国内 AFA 第一
  • 浪潮 AS18000:浪潮信息子业务
  • Vast Data(未上市):硅谷 AI 存储新势力,估值 90 亿美元
  • Weka.io(未上市):并行文件系统,AI 训练首选
  • Solidigm(SK 海力士子公司):企业级 NVMe SSD

景气度判断

当前景气度(描述性) 信号源:澜起科技-688008, 江波龙-301308, 佰维存储-688525, PureStorage-PSTG

景气持续向上,存储 IO 瓶颈成为 AI 集群关键短板。澜起 CXL 类芯片同比 +94% 揭示 AI 推理 KV 缓存场景需求爆发;Pure Storage 与 NVIDIA 联合发布 "AI Factory" 参考架构标志全闪存进入 AI 主流配置。核心矛盾:HBM 短缺导致 GPU 内存不足,CXL 内存池化是关键解决方案,澜起卡位优秀。Q2-Q3 看点:(1) CXL 3.0 在头部云厂商部署进度 / (2) 国产并行文件系统在大型智算中心市占率 / (3) HBM4 量产对存储系统格局影响。

风险提示

关键风险

  • NAND 价格周期:NAND 颗粒价格 2024-2026 年波动 +/-50%,对 SSD/AFA 厂商毛利率影响巨大
  • CXL 标准之争:Intel CXL 联盟 vs OpenCAPI vs CCIX 等接口标准,可能出现碎片化;澜起卡位 CXL 是赌正确路线
  • 大客户内化:OpenAI / 字节等超大客户自研存储(如 OpenAI 与 Oracle 合作自建),独立存储厂商客户结构上不利
  • 国产替代生态成熟度:华为 OceanStor / 浪潮 AS 在私有云市占快速提升,但软件生态(特别是与 PyTorch/TensorFlow 集成)仍需打磨
  • HBM 替代 DRAM:未来 AI 推理可能更依赖 HBM 直接缓存(GPU 内),传统存储系统在某些场景被绕开