Key Highlights

维度核心内容

子行业定位 "GPU 卡时即服务"——介于 IDC（卖空间）和云厂（综合 PaaS）之间的轻资产纯算力供给

商业模式按 GPU 卡时计费（每卡每小时 5-30 元）+ 一次性配置费；A100/H100/华为昇腾不同价位

市场规模 2026 年中国智算服务市场 ~600-800 亿元；全球类似业务 ~500 亿美元

关键指标 GPU 利用率（行业平均 45-65%）/ 卡时单价 / 客户预付款（反映在手订单）

重点公司（A 股）中贝通信（GPU 服务器集成 + 算力租赁双业务）、利通电子、协创数据

海外对标 CoreWeave（私营，纳斯达克 IPO 进程中）、Lambda Labs、Together AI（开源生态）

政策环境 "东数西算"补贴算力券 / 国产 GPU 优先采购 / 算力网络一体化

风险因素 GPU 折旧快（3-4 年残值 30%）/ 卡时价格战 / 大客户自购转私有

维度	核心内容
子行业定位	"GPU 卡时即服务"——介于 IDC（卖空间）和云厂（综合 PaaS）之间的轻资产纯算力供给
商业模式	按 GPU 卡时计费（每卡每小时 5-30 元）+ 一次性配置费；A100/H100/华为昇腾不同价位
市场规模	2026 年中国智算服务市场 ~600-800 亿元；全球类似业务 ~500 亿美元
关键指标	GPU 利用率（行业平均 45-65%）/ 卡时单价 / 客户预付款（反映在手订单）
重点公司（A 股）	中贝通信（GPU 服务器集成 + 算力租赁双业务）、利通电子、协创数据
海外对标	CoreWeave（私营，纳斯达克 IPO 进程中）、Lambda Labs、Together AI（开源生态）
政策环境	"东数西算"补贴算力券 / 国产 GPU 优先采购 / 算力网络一体化
风险因素	GPU 折旧快（3-4 年残值 30%）/ 卡时价格战 / 大客户自购转私有

行业定义与边界

AI 算力租赁是从 IDC 行业演化出的轻资产分支。核心逻辑：客户买 GPU 集群成本高（单台 H100 服务器 50-80 万元，1000 卡集群超 5 亿）+ 利用率低（自用 30-40%），不如租用算力服务商的现有资源。

裸金属租赁：直接租物理 GPU 服务器，客户自己装系统；价格最低，需技术能力
托管型算力：服务商负责 OS / 调度系统 / 监控；客户专注训练；溢价 20-30%
训练即服务：服务商提供完整模型训练流水线（预配置 PyTorch / Megatron 等）；面向中小 AI 创业公司
弹性推理：按 token / 调用计费，无需预留卡时；与 MaaS（L3-01 范畴）有重合

与"L3-04 IDC"的区别：IDC 卖空间（机柜），算力租赁卖资源（GPU 卡时）。一些公司同时做（润泽 + 数据港有部分智算服务收入）。

与"L3-01 云"的区别：云厂综合性大（计算+存储+数据库+AI），算力租赁纯算力（更便宜但功能少）。

市场规模与增长

2026 年规模 ~600-800 亿元（含训练 + 推理算力租赁），同比 +60-80%
增长驱动：(1) AI 创业公司爆发（千余家在用算力）+ (2) 政企不愿自购但需要算力（金融 / 医院 / 高校）+ (3) 国产 GPU 替代提供新供给
CoreWeave（私营）2024 年营收 ~20 亿美元同比 +500%，2025 年预期 50 亿美元；估值约 350 亿美元
整体"GPU 即服务"市场 ~500 亿美元，2024-2027 年 CAGR ~80%

卡时价格水位（2026Q1 参考）：

H100 80GB：每卡每小时 15-25 元（视租期 / 客户）；A100 80GB：8-15 元
华为昇腾 910B：5-12 元
长协（>6 个月）相比散单价格 -30%

关键事件：寒武纪 2026Q1 公告 35 亿元政企算力订单（思元 590 + 配套软件），分两年交付，部分通过智算服务模式分发。

技术演进路线

技术路线

阶段 01

自建GPU集群

CaaS

TaaS

阶段 02

卡时即服务CaaS 高成本+低利用

国产昇腾算力服务 国产GPU适配

一站式AI开发平台 RAG/Agent

阶段 03

训练即服务TaaS

阶段 04

推理即服务IaaS

阶段 05

模型即服务MaaS

原始图谱

flowchart LR
  自建GPU集群 -->|高成本+低利用| 卡时即服务CaaS
  卡时即服务CaaS --> 训练即服务TaaS
  训练即服务TaaS --> 推理即服务IaaS
  推理即服务IaaS --> 模型即服务MaaS
  CaaS -->|国产GPU适配| 国产昇腾算力服务
  TaaS -->|RAG/Agent| 一站式AI开发平台

GPU 虚拟化：单台 GPU 卡可分时复用 ~10 个客户，提高利用率从 30% → 70%
混卡调度：同一集群跨架构（NVIDIA + 华为昇腾）调度，2026 年成为头部厂商标配
大模型预置：智算服务商预先部署 Llama/Qwen/DeepSeek 镜像，客户即开即用
国产生态适配：CANN（华为）/ MUSA（摩尔线程）/ ROCm 等替代 CUDA 生态，2026 年是关键年

产业价值链结构

价值链

上游 GPU 厂商

NVIDIA/华为昇腾/寒武纪

中游 算力服务商

中贝/利通/协创

下游 IDC

润泽/万国

下游 卡时租赁

裸金属

下游 托管训练服务

含调度+监控

下游 模型 API 服务

按 token

下游 AI 创业公司

下游 政企客户

金融/政府/高校

终端 企业 SaaS 客户

原始图谱

flowchart LR
  A[GPU 厂商<br/>NVIDIA/华为昇腾/寒武纪] --> B[算力服务商<br/>中贝/利通/协创]
  C[IDC<br/>润泽/万国] --> B
  B --> D[卡时租赁<br/>裸金属]
  B --> E[托管训练服务<br/>含调度+监控]
  B --> F[模型 API 服务<br/>按 token]
  D --> G[AI 创业公司]
  E --> H[政企客户<br/>金融/政府/高校]
  F --> I[企业 SaaS 客户]

成本构成：GPU 折旧 50-60%（最大头）/ IDC 租金 + 电力 20-25% / 网络 5-10% / 运维 + 销售 10-15%

毛利率：行业 25-40%，含 GPU 折旧后净利率 5-15%（成熟期）；爬坡期亏损（前 6-12 个月）

重点公司

本土龙头

中贝通信（603220.SH）：从 5G 通信工程转型 AI 算力服务；2025 年算力业务收入占比超 50%；与中国电信 / 移动云合作 GPU 集群，托管 H100 + 昇腾混合算力 ~3,000 卡；客户结构以政企 / 央企子公司为主；财务：2026Q1 营收同比 +35%
利通电子（603629.SH）：精密结构件 + 算力服务双轮；2024 年起切入 AI 算力 GPU 集群租赁，杭州 / 长沙节点；卡时定价中位水平；2025 年算力业务营收占比 30-40%
协创数据（300857.SZ）：精密结构件起家，2024 年布局 GPU 服务器 + 算力服务；规模较小但增速快，与多家 AI 创业公司签约长期算力合同

海外对标

CoreWeave（未上市，纳斯达克 IPO 进程中）：全球最大独立 GPU 即服务厂商，2024 年营收 20 亿美元同比 +500%，2025 年估值 350 亿美元；与 NVIDIA、Microsoft 深度合作，OpenAI / Cohere / Mistral 是主要客户
Lambda Labs：硅谷"GPU 即服务"代表，主打 ML/AI 训练；2024 年完成 4.8 亿美元 D 轮融资
Together AI：开源模型生态 + 算力服务（已在 KB 未上市/）；2024 年 ARR 增长超 10 倍

未升格公司清单

中国电信 / 中国移动（已在 L3-01 列）：运营商系智算服务最大供给方，未单独建子 note
英博数科（未上市）：国内独立智算服务玩家
阿里云 / 百度智能云：综合云厂商也提供算力租赁，未单独建子行业 note

景气度判断

当前景气度（描述性） 信号源：寒武纪-688256, 海光信息-688041, 沐曦股份-688802, 中贝通信-603220

高景气，但盈利能力分化。AI 创业公司 + 政企算力需求爆发驱动卡时收入快速增长（中贝通信 +35%）。国产 GPU 算力供给集中释放（寒武纪 35 亿订单 / 海光 Q1 +68% / 沐曦 Q1 +75%），算力服务商有更便宜的"国产替代品"可上架。核心矛盾：H100/H200 仍紧缺（黑市价格高于官方 50%+），国产 GPU 客户接受度需要 6-12 个月生态成熟。Q2-Q3 看点：思元 590 量产交付 + 昇腾 910C 在算力服务商的部署比例。

风险提示

关键风险

GPU 折旧风险：H100 4 年残值约 30%，A100 残值约 25%；如下一代（B200/Rubin）大幅领先，存量 GPU 可能加速贬值

卡时价格战：算力服务商之间竞争 + 云厂综合性服务挤压；H100 卡时 2024 年 35 元 → 2026Q1 18-25 元，降幅 30%+

大客户自购转私有云：百度 / 字节等大模型公司倾向自建集群，独立算力服务商客户结构上中小化

GPU 进口管制升级：美方限制 H100 / B200 中国销售，影响存量供给和未来扩展能力

国产 GPU 生态成熟度：CUDA → 国产生态的迁移成本高，部分客户拒绝国产替代