AI 算力租赁与智算服务
关键信息摘要
Key Highlights
维度 核心内容 子行业定位 "GPU 卡时即服务"——介于 IDC(卖空间)和云厂(综合 PaaS)之间的轻资产纯算力供给 商业模式 按 GPU 卡时计费(每卡每小时 5-30 元)+ 一次性配置费;A100/H100/华为昇腾不同价位 市场规模 2026 年中国智算服务市场 ~600-800 亿元;全球类似业务 ~500 亿美元 关键指标 GPU 利用率(行业平均 45-65%)/ 卡时单价 / 客户预付款(反映在手订单) 重点公司(A 股) 中贝通信(GPU 服务器集成 + 算力租赁双业务)、利通电子、协创数据 海外对标 CoreWeave(私营,纳斯达克 IPO 进程中)、Lambda Labs、Together AI(开源生态) 政策环境 "东数西算"补贴算力券 / 国产 GPU 优先采购 / 算力网络一体化 风险因素 GPU 折旧快(3-4 年残值 30%)/ 卡时价格战 / 大客户自购转私有
行业定义与边界
AI 算力租赁是从 IDC 行业演化出的轻资产分支。核心逻辑:客户买 GPU 集群成本高(单台 H100 服务器 50-80 万元,1000 卡集群超 5 亿)+ 利用率低(自用 30-40%),不如租用算力服务商的现有资源。
- 裸金属租赁:直接租物理 GPU 服务器,客户自己装系统;价格最低,需技术能力
- 托管型算力:服务商负责 OS / 调度系统 / 监控;客户专注训练;溢价 20-30%
- 训练即服务:服务商提供完整模型训练流水线(预配置 PyTorch / Megatron 等);面向中小 AI 创业公司
- 弹性推理:按 token / 调用计费,无需预留卡时;与 MaaS(L3-01 范畴)有重合
与"L3-04 IDC"的区别:IDC 卖空间(机柜),算力租赁卖资源(GPU 卡时)。一些公司同时做(润泽 + 数据港有部分智算服务收入)。
与"L3-01 云"的区别:云厂综合性大(计算+存储+数据库+AI),算力租赁纯算力(更便宜但功能少)。
市场规模与增长
-
2026 年规模 ~600-800 亿元(含训练 + 推理算力租赁),同比 +60-80%
-
增长驱动:(1) AI 创业公司爆发(千余家在用算力)+ (2) 政企不愿自购但需要算力(金融 / 医院 / 高校)+ (3) 国产 GPU 替代提供新供给
-
CoreWeave(私营)2024 年营收 ~20 亿美元同比 +500%,2025 年预期 50 亿美元;估值约 350 亿美元
-
整体"GPU 即服务"市场 ~500 亿美元,2024-2027 年 CAGR ~80%
卡时价格水位(2026Q1 参考):
- H100 80GB:每卡每小时 15-25 元(视租期 / 客户);A100 80GB:8-15 元
- 华为昇腾 910B:5-12 元
- 长协(>6 个月)相比散单价格 -30%
关键事件:寒武纪 2026Q1 公告 35 亿元政企算力订单(思元 590 + 配套软件),分两年交付,部分通过智算服务模式分发。
技术演进路线
原始图谱
flowchart LR
自建GPU集群 -->|高成本+低利用| 卡时即服务CaaS
卡时即服务CaaS --> 训练即服务TaaS
训练即服务TaaS --> 推理即服务IaaS
推理即服务IaaS --> 模型即服务MaaS
CaaS -->|国产GPU适配| 国产昇腾算力服务
TaaS -->|RAG/Agent| 一站式AI开发平台- GPU 虚拟化:单台 GPU 卡可分时复用 ~10 个客户,提高利用率从 30% → 70%
- 混卡调度:同一集群跨架构(NVIDIA + 华为昇腾)调度,2026 年成为头部厂商标配
- 大模型预置:智算服务商预先部署 Llama/Qwen/DeepSeek 镜像,客户即开即用
- 国产生态适配:CANN(华为)/ MUSA(摩尔线程)/ ROCm 等替代 CUDA 生态,2026 年是关键年
产业价值链结构
NVIDIA/华为昇腾/寒武纪
中贝/利通/协创
润泽/万国
裸金属
含调度+监控
按 token
金融/政府/高校
原始图谱
flowchart LR
A[GPU 厂商<br/>NVIDIA/华为昇腾/寒武纪] --> B[算力服务商<br/>中贝/利通/协创]
C[IDC<br/>润泽/万国] --> B
B --> D[卡时租赁<br/>裸金属]
B --> E[托管训练服务<br/>含调度+监控]
B --> F[模型 API 服务<br/>按 token]
D --> G[AI 创业公司]
E --> H[政企客户<br/>金融/政府/高校]
F --> I[企业 SaaS 客户]成本构成:GPU 折旧 50-60%(最大头)/ IDC 租金 + 电力 20-25% / 网络 5-10% / 运维 + 销售 10-15%
毛利率:行业 25-40%,含 GPU 折旧后净利率 5-15%(成熟期);爬坡期亏损(前 6-12 个月)
重点公司
本土龙头
- 中贝通信(603220.SH):从 5G 通信工程转型 AI 算力服务;2025 年算力业务收入占比超 50%;与中国电信 / 移动云合作 GPU 集群,托管 H100 + 昇腾混合算力 ~3,000 卡;客户结构以政企 / 央企子公司为主;财务:2026Q1 营收同比 +35%
- 利通电子(603629.SH):精密结构件 + 算力服务双轮;2024 年起切入 AI 算力 GPU 集群租赁,杭州 / 长沙节点;卡时定价中位水平;2025 年算力业务营收占比 30-40%
- 协创数据(300857.SZ):精密结构件起家,2024 年布局 GPU 服务器 + 算力服务;规模较小但增速快,与多家 AI 创业公司签约长期算力合同
海外对标
- CoreWeave(未上市,纳斯达克 IPO 进程中):全球最大独立 GPU 即服务厂商,2024 年营收 20 亿美元同比 +500%,2025 年估值 350 亿美元;与 NVIDIA、Microsoft 深度合作,OpenAI / Cohere / Mistral 是主要客户
- Lambda Labs:硅谷"GPU 即服务"代表,主打 ML/AI 训练;2024 年完成 4.8 亿美元 D 轮融资
- Together AI:开源模型生态 + 算力服务(已在 KB 未上市/);2024 年 ARR 增长超 10 倍
未升格公司清单
- 中国电信 / 中国移动(已在 L3-01 列):运营商系智算服务最大供给方,未单独建子 note
- 英博数科(未上市):国内独立智算服务玩家
- 阿里云 / 百度智能云:综合云厂商也提供算力租赁,未单独建子行业 note
景气度判断
当前景气度(描述性) 信号源:寒武纪-688256, 海光信息-688041, 沐曦股份-688802, 中贝通信-603220
高景气,但盈利能力分化。AI 创业公司 + 政企算力需求爆发驱动卡时收入快速增长(中贝通信 +35%)。国产 GPU 算力供给集中释放(寒武纪 35 亿订单 / 海光 Q1 +68% / 沐曦 Q1 +75%),算力服务商有更便宜的"国产替代品"可上架。核心矛盾:H100/H200 仍紧缺(黑市价格高于官方 50%+),国产 GPU 客户接受度需要 6-12 个月生态成熟。Q2-Q3 看点:思元 590 量产交付 + 昇腾 910C 在算力服务商的部署比例。
风险提示
关键风险
- GPU 折旧风险:H100 4 年残值约 30%,A100 残值约 25%;如下一代(B200/Rubin)大幅领先,存量 GPU 可能加速贬值
- 卡时价格战:算力服务商之间竞争 + 云厂综合性服务挤压;H100 卡时 2024 年 35 元 → 2026Q1 18-25 元,降幅 30%+
- 大客户自购转私有云:百度 / 字节等大模型公司倾向自建集群,独立算力服务商客户结构上中小化
- GPU 进口管制升级:美方限制 H100 / B200 中国销售,影响存量供给和未来扩展能力
- 国产 GPU 生态成熟度:CUDA → 国产生态的迁移成本高,部分客户拒绝国产替代