GPU与AI加速器

关键信息摘要
Key Highlights
- 全球AI加速芯片2024年约1,160亿美元,2026E约1,600–1,800亿美元,CAGR约25–30%;NVIDIA以约3.2万亿美元市值占数据中心AI GPU 80–90%份额,FY2025数据中心营收1,152亿美元(+142% YoY)
- 中国AI芯片2024年约1,425亿元,国产化率约30%(2025年预计>40%,2027年目标55%);华为昇腾国产市占率约23%;NVIDIA以约200亿美元收购Groq资产(2025),Intel据报签署收购SambaNova意向书
- 国产IPO潮:摩尔线程(688795.SH)2025年12月上市首日市值>3,000亿元;寒武纪(688256.SH)2025H1营收+4,348%首次扭亏为盈;壁仞(港股拟IPO)、燧原(科创板辅导)、沐曦(辅导完成)仍在冲刺
行业定义与边界
AI加速芯片是专为AI训练和推理工作负载设计的高性能计算芯片,覆盖四类架构:
- 通用GPU(NVIDIA CUDA架构为事实标准):A100/H100/H200/B200/GB200系列
- 定制ASIC(针对特定算子硬件优化):Google TPU、AWS Trainium/Inferentia、华为昇腾、寒武纪思元
- 晶圆级/新架构:Cerebras WSE-3(整片晶圆集成)、Tenstorrent RISC-V AI加速器、SambaNova RDU
- FPGA加速器:低延迟推理场景小众应用(详见L2-03)
本行业聚焦数据中心级AI训练与推理芯片,不含边缘AI芯片、通用CPU、HBM存储、网络互联芯片。
市场规模与增长
- 全球:2024年约1,160亿美元 → 2026年约1,600–1,800亿美元,CAGR约25–30%;ASIC细分以27% CAGR增长(Broadcom占60–80%份额)
- 中国:2024年约1,425亿元人民币;Bernstein估计2025年中国需求约395亿美元(国产份额42%);弗若斯特沙利文预测2024–2029年CAGR 53.7%
- 超大规模资本支出:2025年全球云厂商AI基础设施支出超3,800亿美元;2025年中国AI资本支出约910亿美元(互联网400亿+国企200亿+地方政府150亿)
技术演进路线
CUDA FP32 · H100 H200
7nm成熟制程 · 昇腾910B 寒武纪590
FP8/FP4支持 · GB200 NVL72机架级 · NVLink 5.0互联
Chiplet封装 · 软件生态建设
2nm制程 · 台积电独供
CANN/ROCm替代 · 2027年目标55%国产化率
原始图谱
flowchart LR
A[传统GPU\nCUDA FP32\nH100 H200] --> B[Blackwell架构\nFP8/FP4支持\nGB200 NVL72机架级\nNVLink 5.0互联]
B --> C[Rubin下一代\n2nm制程\n台积电独供]
D[国产第一代\n7nm成熟制程\n昇腾910B 寒武纪590] --> E[国产第二代\nChiplet封装\n软件生态建设]
E --> F[国产生态成熟\nCANN/ROCm替代\n2027年目标55%国产化率]产业价值链结构
Synopsys Cadence ARM · EDA生态
NVIDIA AMD · 华为海思 寒武纪
台积电3nm-5nm · 中芯国际7nm
服务器ODM · DGX系统 整机柜
Hyperscaler · 国内智算中心
原始图谱
flowchart LR
A[设计工具&IP\nSynopsys Cadence ARM\nEDA生态] --> B[AI芯片设计\nNVIDIA AMD\n华为海思 寒武纪]
B --> C[代工封装\n台积电3nm-5nm\n中芯国际7nm]
C --> D[系统集成\n服务器ODM\nDGX系统 整机柜]
D --> E[云/算力运营\nHyperscaler\n国内智算中心]重点公司
本土龙头
- 寒武纪(688256.SH) — A股AI芯片龙头,思元590系列;2025H1营收28.81亿元(+4,348% YoY),首次扭亏为盈;市值约2,800–3,000亿元;主要客户为运营商、城市智算中心
- 海光信息(688041.SH) — 国产AI芯片营收规模最大、盈利最强的上市公司;深算系列DCU(ROCm兼容架构,CUDA迁移成本最低);2025H1营收54.64亿元(+45.2%),净利润12.01亿元(+40.8%);与中科曙光形成"芯片+整机"战略组合
- 摩尔线程(688795.SH) — 2025年12月科创板上市,首日市值>3,000亿元;MTT S80/S4000系列GPU,新一代"平湖"架构;2025H1营收7.02亿元;创始人张建中为NVIDIA中国区前负责人
- 华为昇腾(未上市)— 国产AI芯片绝对领军者,国产市占率约23%;Ascend 910B/910C;2024年出货超64万片;CANN软件栈+MindSpore框架+昇腾AI云服务全栈布局;20多个城市智算中心占据79%份额;先进制程依赖中芯国际7nm
- 燧原科技(未上市,IPO辅导中)— 云燧T20/T21训练芯片+i20推理芯片;腾讯为第一大股东(持股20.49%,连续6轮投资);估值约205亿元;已在上海证监局完成上市辅导备案(中金公司辅导)
海外对标
- NVIDIA(NVDA) — 全球AI算力绝对霸主;H100/B200/GB200系列;FY2025数据中心营收1,152亿美元(+142%);CUDA生态400万+开发者是最深护城河;2025年以约200亿美元收购Groq资产(AI推理芯片,史上最大并购);市值约3.2万亿美元
- AMD(AMD) — NVIDIA最有力挑战者;MI300X拥有192GB HBM3E内存和5.3 TB/s带宽,大模型推理具有成本优势;与OpenAI签署6GW战略合作;ROCm生态快速改善
- Google TPU Trillium / AWS Trainium2 — 超大规模云厂商自研ASIC,"去NVIDIA化"战略;Annapurna Labs(2015年被Amazon收购)是AWS芯片研发核心团队;Broadcom为Google TPU核心ASIC设计合作伙伴
未升格公司清单
留作行业全景参考,未单独建 note。出现重大催化时考虑升格。
- 壁仞科技(未上市,港股IPO计划,BR100系列通用GPU,已被列入美国实体清单)
- 沐曦集成(未上市,已完成IPO辅导,CUDA/ROCm兼容GPU)
- 天数智芯(9903.HK,已在港交所上市,天垓100系列)
- Cerebras Systems(未上市,估值230亿美元,WSE-3晶圆级引擎)
- Tenstorrent(未上市,估值约30–32亿美元,RISC-V AI加速器,Jim Keller主导)
景气度判断
当前景气度(描述性) 信号源:寒武纪 海光信息 摩尔线程 财报;Bloomberg Intelligence;Bernstein研究
景气度极高,处于AI算力超级周期中。2025年全球云厂商AI基础设施资本支出超3,800亿美元,中国AI资本支出910亿美元,需求端极为旺盛。国产化率加速提升(30%→42%)。主要风险:NVIDIA CUDA生态护城河短期难以超越;中国先进制程受限导致国产芯片性能落差持续;国产AI芯片IPO估值普遍极高(寒武纪PE数百倍),泡沫风险大。
风险提示
关键风险
- CUDA生态护城河:NVIDIA 20年积累的CUDA软件生态(400万+开发者、3,000+优化应用)是短期内无法复制的竞争壁垒;国内软件生态(CANN/ROCm/Cambricon)成熟度差距制约国产替代速度
- 先进制程受限+估值泡沫:中国AI芯片厂商依赖中芯国际7nm,与台积电3nm/2nm的性能差距持续扩大;国产AI芯片上市公司(寒武纪、摩尔线程)估值极高(市值/营收比数十至数百倍),业绩不达预期时回调风险极大