L2 芯片与硬件

GPU与AI加速器

当前核心信号:2025年超大规模云厂商AI基础设施支出超3,800亿美元;中国AI资本支出约910亿美元

一句话判断

GPU与AI加速器 是 L2 芯片与硬件中连接上游供给、产业约束和下游 AI 需求的关键环节,当前主要观察 CUDA软件生态(400万+开发者)构成NVIDIA最深护城河;国产芯片先进制程受限(依赖中芯国际7nm);软件栈(CANN/Cambricon Neuware)与CUDA生态差距仍大。

关键瓶颈 CUDA软件生态(400万+开发者)构成NVIDIA最深护城河;国产芯片先进制程受限(依赖中芯国际7nm);软件栈(CANN/Cambricon Neuware)与CUDA生态差距仍大
代表公司 9 家
内容状态 部分填充

核心约束

先看卡点
CUDA软件生态(400万+开发者)构成NVIDIA最深护城河;国产芯片先进制程受限(依赖中芯国际7nm);软件栈(CANN/Cambricon Neuware)与CUDA生态差距仍大

2025年超大规模云厂商AI基础设施支出超3,800亿美元;中国AI资本支出约910亿美元 · 2026-05-11

代表公司

9 家

近期催化

10 条

研究笔记

来自 Obsidian

GPU与AI加速器

GPU 与 AI 加速器产业视觉图

关键信息摘要

Key Highlights

  • 全球AI加速芯片2024年约1,160亿美元,2026E约1,600–1,800亿美元,CAGR约25–30%;NVIDIA以约3.2万亿美元市值占数据中心AI GPU 80–90%份额,FY2025数据中心营收1,152亿美元(+142% YoY)
  • 中国AI芯片2024年约1,425亿元,国产化率约30%(2025年预计>40%,2027年目标55%);华为昇腾国产市占率约23%;NVIDIA以约200亿美元收购Groq资产(2025),Intel据报签署收购SambaNova意向书
  • 国产IPO潮:摩尔线程(688795.SH)2025年12月上市首日市值>3,000亿元;寒武纪(688256.SH)2025H1营收+4,348%首次扭亏为盈;壁仞(港股拟IPO)、燧原(科创板辅导)、沐曦(辅导完成)仍在冲刺

行业定义与边界

AI加速芯片是专为AI训练和推理工作负载设计的高性能计算芯片,覆盖四类架构:

  1. 通用GPU(NVIDIA CUDA架构为事实标准):A100/H100/H200/B200/GB200系列
  2. 定制ASIC(针对特定算子硬件优化):Google TPU、AWS Trainium/Inferentia、华为昇腾、寒武纪思元
  3. 晶圆级/新架构:Cerebras WSE-3(整片晶圆集成)、Tenstorrent RISC-V AI加速器、SambaNova RDU
  4. FPGA加速器:低延迟推理场景小众应用(详见L2-03)

本行业聚焦数据中心级AI训练与推理芯片,不含边缘AI芯片、通用CPU、HBM存储、网络互联芯片。

市场规模与增长

  • 全球:2024年约1,160亿美元 → 2026年约1,600–1,800亿美元,CAGR约25–30%;ASIC细分以27% CAGR增长(Broadcom占60–80%份额)
  • 中国:2024年约1,425亿元人民币;Bernstein估计2025年中国需求约395亿美元(国产份额42%);弗若斯特沙利文预测2024–2029年CAGR 53.7%
  • 超大规模资本支出:2025年全球云厂商AI基础设施支出超3,800亿美元;2025年中国AI资本支出约910亿美元(互联网400亿+国企200亿+地方政府150亿)

技术演进路线

技术路线
阶段 01
传统GPU

CUDA FP32 · H100 H200

国产第一代

7nm成熟制程 · 昇腾910B 寒武纪590

阶段 02
Blackwell架构

FP8/FP4支持 · GB200 NVL72机架级 · NVLink 5.0互联

国产第二代

Chiplet封装 · 软件生态建设

阶段 03
Rubin下一代

2nm制程 · 台积电独供

国产生态成熟

CANN/ROCm替代 · 2027年目标55%国产化率

原始图谱
flowchart LR
  A[传统GPU\nCUDA FP32\nH100 H200] --> B[Blackwell架构\nFP8/FP4支持\nGB200 NVL72机架级\nNVLink 5.0互联]
  B --> C[Rubin下一代\n2nm制程\n台积电独供]

  D[国产第一代\n7nm成熟制程\n昇腾910B 寒武纪590] --> E[国产第二代\nChiplet封装\n软件生态建设]
  E --> F[国产生态成熟\nCANN/ROCm替代\n2027年目标55%国产化率]

产业价值链结构

价值链
上游 设计工具&IP

Synopsys Cadence ARM · EDA生态

中游 AI芯片设计

NVIDIA AMD · 华为海思 寒武纪

下游 代工封装

台积电3nm-5nm · 中芯国际7nm

下游 系统集成

服务器ODM · DGX系统 整机柜

终端 云/算力运营

Hyperscaler · 国内智算中心

原始图谱
flowchart LR
  A[设计工具&IP\nSynopsys Cadence ARM\nEDA生态] --> B[AI芯片设计\nNVIDIA AMD\n华为海思 寒武纪]
  B --> C[代工封装\n台积电3nm-5nm\n中芯国际7nm]
  C --> D[系统集成\n服务器ODM\nDGX系统 整机柜]
  D --> E[云/算力运营\nHyperscaler\n国内智算中心]

重点公司

本土龙头

  • 寒武纪(688256.SH — A股AI芯片龙头,思元590系列;2025H1营收28.81亿元(+4,348% YoY),首次扭亏为盈;市值约2,800–3,000亿元;主要客户为运营商、城市智算中心
  • 海光信息(688041.SH — 国产AI芯片营收规模最大、盈利最强的上市公司;深算系列DCU(ROCm兼容架构,CUDA迁移成本最低);2025H1营收54.64亿元(+45.2%),净利润12.01亿元(+40.8%);与中科曙光形成"芯片+整机"战略组合
  • 摩尔线程(688795.SH — 2025年12月科创板上市,首日市值>3,000亿元;MTT S80/S4000系列GPU,新一代"平湖"架构;2025H1营收7.02亿元;创始人张建中为NVIDIA中国区前负责人
  • 华为昇腾(未上市)— 国产AI芯片绝对领军者,国产市占率约23%;Ascend 910B/910C;2024年出货超64万片;CANN软件栈+MindSpore框架+昇腾AI云服务全栈布局;20多个城市智算中心占据79%份额;先进制程依赖中芯国际7nm
  • 燧原科技(未上市,IPO辅导中)— 云燧T20/T21训练芯片+i20推理芯片;腾讯为第一大股东(持股20.49%,连续6轮投资);估值约205亿元;已在上海证监局完成上市辅导备案(中金公司辅导)

海外对标

  • NVIDIA(NVDA) — 全球AI算力绝对霸主;H100/B200/GB200系列;FY2025数据中心营收1,152亿美元(+142%);CUDA生态400万+开发者是最深护城河;2025年以约200亿美元收购Groq资产(AI推理芯片,史上最大并购);市值约3.2万亿美元
  • AMD(AMD) — NVIDIA最有力挑战者;MI300X拥有192GB HBM3E内存和5.3 TB/s带宽,大模型推理具有成本优势;与OpenAI签署6GW战略合作;ROCm生态快速改善
  • Google TPU Trillium / AWS Trainium2 — 超大规模云厂商自研ASIC,"去NVIDIA化"战略;Annapurna Labs(2015年被Amazon收购)是AWS芯片研发核心团队;Broadcom为Google TPU核心ASIC设计合作伙伴

未升格公司清单

留作行业全景参考,未单独建 note。出现重大催化时考虑升格。

  • 壁仞科技(未上市,港股IPO计划,BR100系列通用GPU,已被列入美国实体清单)
  • 沐曦集成(未上市,已完成IPO辅导,CUDA/ROCm兼容GPU)
  • 天数智芯(9903.HK,已在港交所上市,天垓100系列)
  • Cerebras Systems(未上市,估值230亿美元,WSE-3晶圆级引擎)
  • Tenstorrent(未上市,估值约30–32亿美元,RISC-V AI加速器,Jim Keller主导)

景气度判断

当前景气度(描述性) 信号源:寒武纪 海光信息 摩尔线程 财报;Bloomberg Intelligence;Bernstein研究

景气度极高,处于AI算力超级周期中。2025年全球云厂商AI基础设施资本支出超3,800亿美元,中国AI资本支出910亿美元,需求端极为旺盛。国产化率加速提升(30%→42%)。主要风险:NVIDIA CUDA生态护城河短期难以超越;中国先进制程受限导致国产芯片性能落差持续;国产AI芯片IPO估值普遍极高(寒武纪PE数百倍),泡沫风险大。

风险提示

关键风险

  • CUDA生态护城河:NVIDIA 20年积累的CUDA软件生态(400万+开发者、3,000+优化应用)是短期内无法复制的竞争壁垒;国内软件生态(CANN/ROCm/Cambricon)成熟度差距制约国产替代速度
  • 先进制程受限+估值泡沫:中国AI芯片厂商依赖中芯国际7nm,与台积电3nm/2nm的性能差距持续扩大;国产AI芯片上市公司(寒武纪、摩尔线程)估值极高(市值/营收比数十至数百倍),业绩不达预期时回调风险极大