AI 存储系统
关键信息摘要
Key Highlights
维度 核心内容 子行业定位 AI 集群的"高速 IO 系统"——存放训练数据集 + 模型 checkpoint + 推理 KV 缓存 商业模式 存储设备 + 存储软件(文件系统/对象存储)+ 增值服务;按 TB/PB 计价或一次性卖 市场规模 2026 年全球 AI 存储 ~250 亿美元;中国 AI 存储 ~400 亿元 关键指标 单卡读写带宽(GB/s)/ 存储 + GPU 比(建议 1:5)/ 全闪存渗透率(>70% 视为高端) 重点公司(A 股) 澜起科技(内存接口/CXL)、江波龙 / 佰维(企业级 SSD)、深科技 / 朗科 海外对标 Pure Storage(全闪存龙头)、NetApp(混合型)、Vast Data(私营,AI 存储新势力) 政策环境 国产存储替代 / 自主可控存储栈 / 数据安全合规 风险因素 内存价格周期波动 / 与 GPU 厂商的接口标准之争 / 大客户内化(OpenAI 自研存储)
行业定义与边界
AI 存储系统是与 GPU 集群匹配的高速 IO 系统。核心问题:单台 H100 服务器训练时每秒需要 30-100 GB 数据喂入,传统 HDD(150 MB/s)+ SATA SSD(500 MB/s)远远不够。
- NVMe SSD 单盘:单盘性能 5-15 GB/s,AI 集群标配
- 全闪存阵列(AFA):多盘聚合,提供 PB 级容量 + 100+ GB/s 吞吐;Pure Storage / NetApp / 华为 OceanStor
- 分布式并行文件系统:Lustre / GPFS / WekaFS / DAOS——大规模 AI 集群必备
- CXL 内存池化:跨服务器共享内存,缓解 GPU 内存不足;澜起 CXL 芯片是关键
- 对象存储:训练数据集存储;MinIO / Ceph / AWS S3
与 L2-07 存储 HBM/DDR5/NAND 的区别:L2-07 是"存储芯片层"(HBM 颗粒 / NAND 颗粒),L3-08 是"存储系统层"(用这些芯片组装的设备)。L3-08 的玩家从 L2-07 采购颗粒。
与 L3-04 IDC 区别:IDC 卖空间 + 电力,存储系统卖盘 + 文件系统软件。但许多 IDC 厂商提供存储增值服务。
市场规模与增长
-
2026 年规模 ~250 亿美元,同比 +35%;2024-2029 年 CAGR 28-32%
-
主要拐点:从"AI 训练存储"扩展到"AI 推理 KV 缓存存储",后者 2025 年起爆发
-
2026 年规模 ~400 亿元,同比 +40%
-
国产替代率:企业级 SSD ~50%,AFA ~30%,并行文件系统 ~40%(华为 / 浪潮 / 曙光)
-
单 GPU 读写带宽要求:H100 推荐 30 GB/s,B200 推荐 50 GB/s,Rubin 推荐 80+ GB/s
-
存储 GPU 比:训练集群推荐 1 GPU : 5 TB 高速存储(不含数据集)
-
全闪存渗透率:通用 IDC ~30%,AI 智算 IDC ~75%
澜起科技 CXL 信号(2026Q1):
- 互连类芯片营收 14.17 亿元同比 +24.4%
- MRCD/MDB/PCIe Retimer/CKD/CXL MXC 合计 2.69 亿元 同比 +93.8%
- CXL MXC 卡位 AI 推理 KV 缓存内存池化
技术演进路线
原始图谱
flowchart LR
HDD机械硬盘 -->|带宽不足| SATA_SSD
SATA_SSD -->|带宽300x| NVMe_SSD
NVMe_SSD -->|聚合扩容| 全闪存阵列AFA
全闪存阵列AFA -->|分布式扩展| 并行文件系统PFS
并行文件系统PFS -->|跨服务器共享| CXL内存池化
CXL内存池化 --> AI推理KV缓存
并行文件系统PFS --> AI训练数据集- NVMe 全闪化:传统机械硬盘逐步退出 AI 集群,全闪存渗透率 2026 年破 70%
- CXL 内存池化:跨服务器共享内存(CXL 3.0),打破单机内存物理限制;澜起 CXL MXC 是关键芯片
- 并行文件系统软件栈:Lustre/GPFS 等老牌 + WekaFS/DAOS 等新势力,竞争激烈
- 国产替代浪潮:华为 OceanStor / 浪潮 AS18000 / 曙光 ParaStor 等国产 AFA 加速渗透
产业价值链结构
三星/海力士/长江存储
江波龙/佰维/Solidigm
澜起 CXL/MXC
Pure/NetApp/华为 OceanStor
WekaFS/Lustre/DAOS
数据 IO 喂入 GPU
KV 缓存
原始图谱
flowchart LR
A[NAND 颗粒<br/>三星/海力士/长江存储] --> B[企业级 SSD<br/>江波龙/佰维/Solidigm]
C[内存接口芯片<br/>澜起 CXL/MXC] --> D[内存模组与内存池化设备]
B --> E[全闪存阵列 AFA<br/>Pure/NetApp/华为 OceanStor]
D --> E
E --> F[并行文件系统<br/>WekaFS/Lustre/DAOS]
F --> G[AI 训练集群<br/>数据 IO 喂入 GPU]
F --> H[AI 推理集群<br/>KV 缓存]成本构成:NAND/内存颗粒 50-60% / 控制器芯片 + 接口 15-20% / 软件研发 + 集成 15-20% / 销售 5-10%
毛利率:全闪存阵列 30-45%(Pure 41%)/ NVMe SSD 20-30% / CXL 接口芯片(澜起)70%+
重点公司
本土龙头
- 澜起科技(688008.SH):内存接口 + CXL 互连领军者;2026Q1 营收 14.61 亿元同比 +20%、归母 +61%;DDR5 RCD 芯片量价齐升,MRCD/MDB/PCIe Retimer/CKD/CXL MXC 合计同比 +93.8%;毛利率 69.8% 同比 +9.3pct;CXL MXC 卡位 AI 推理 KV 缓存内存池化关键节点
海外对标
- Pure Storage(PSTG.US):全闪存阵列龙头,2025 年营收 ~30 亿美元同比 +13%;DirectFlash 技术性能 + 容量优势;与 NVIDIA 深度合作"AI Factory"参考架构;毛利率 ~70%
- NetApp(NTAP.US):混合存储龙头,2025 年营收 ~63 亿美元;ONTAP 软件栈业界经典;AI 业务增速放缓但稳定;与 NVIDIA 协同 OnTAP for AI 解决方案
未升格公司清单
- 江波龙(301308.SZ):企业级 SSD(已在 L2-07 列)
- 佰维存储(688525.SH):嵌入式 + 企业级 SSD(已在 L2-07 列)
- 深科技(000021.SZ):存储产品 OEM
- 朗科科技(300042.SZ):消费级存储为主
- 华为 OceanStor(未上市):国内 AFA 第一
- 浪潮 AS18000:浪潮信息子业务
- Vast Data(未上市):硅谷 AI 存储新势力,估值 90 亿美元
- Weka.io(未上市):并行文件系统,AI 训练首选
- Solidigm(SK 海力士子公司):企业级 NVMe SSD
景气度判断
当前景气度(描述性) 信号源:澜起科技-688008, 江波龙-301308, 佰维存储-688525, PureStorage-PSTG
景气持续向上,存储 IO 瓶颈成为 AI 集群关键短板。澜起 CXL 类芯片同比 +94% 揭示 AI 推理 KV 缓存场景需求爆发;Pure Storage 与 NVIDIA 联合发布 "AI Factory" 参考架构标志全闪存进入 AI 主流配置。核心矛盾:HBM 短缺导致 GPU 内存不足,CXL 内存池化是关键解决方案,澜起卡位优秀。Q2-Q3 看点:(1) CXL 3.0 在头部云厂商部署进度 / (2) 国产并行文件系统在大型智算中心市占率 / (3) HBM4 量产对存储系统格局影响。
风险提示
关键风险
- NAND 价格周期:NAND 颗粒价格 2024-2026 年波动 +/-50%,对 SSD/AFA 厂商毛利率影响巨大
- CXL 标准之争:Intel CXL 联盟 vs OpenCAPI vs CCIX 等接口标准,可能出现碎片化;澜起卡位 CXL 是赌正确路线
- 大客户内化:OpenAI / 字节等超大客户自研存储(如 OpenAI 与 Oracle 合作自建),独立存储厂商客户结构上不利
- 国产替代生态成熟度:华为 OceanStor / 浪潮 AS 在私有云市占快速提升,但软件生态(特别是与 PyTorch/TensorFlow 集成)仍需打磨
- HBM 替代 DRAM:未来 AI 推理可能更依赖 HBM 直接缓存(GPU 内),传统存储系统在某些场景被绕开