Key Highlights

全球AI加速芯片2024年约1,160亿美元，2026E约1,600–1,800亿美元，CAGR约25–30%；NVIDIA以约3.2万亿美元市值占数据中心AI GPU 80–90%份额，FY2025数据中心营收1,152亿美元（+142% YoY）

中国AI芯片2024年约1,425亿元，国产化率约30%（2025年预计>40%，2027年目标55%）；华为昇腾国产市占率约23%；NVIDIA以约200亿美元收购Groq资产（2025），Intel据报签署收购SambaNova意向书

国产IPO潮：摩尔线程（688795.SH）2025年12月上市首日市值>3,000亿元；寒武纪（688256.SH）2025H1营收+4,348%首次扭亏为盈；壁仞（港股拟IPO）、燧原（科创板辅导）、沐曦（辅导完成）仍在冲刺

行业定义与边界

AI加速芯片是专为AI训练和推理工作负载设计的高性能计算芯片，覆盖四类架构：

通用GPU（NVIDIA CUDA架构为事实标准）：A100/H100/H200/B200/GB200系列
定制ASIC（针对特定算子硬件优化）：Google TPU、AWS Trainium/Inferentia、华为昇腾、寒武纪思元
晶圆级/新架构：Cerebras WSE-3（整片晶圆集成）、Tenstorrent RISC-V AI加速器、SambaNova RDU
FPGA加速器：低延迟推理场景小众应用（详见L2-03）

本行业聚焦数据中心级AI训练与推理芯片，不含边缘AI芯片、通用CPU、HBM存储、网络互联芯片。

市场规模与增长

全球：2024年约1,160亿美元 → 2026年约1,600–1,800亿美元，CAGR约25–30%；ASIC细分以27% CAGR增长（Broadcom占60–80%份额）
中国：2024年约1,425亿元人民币；Bernstein估计2025年中国需求约395亿美元（国产份额42%）；弗若斯特沙利文预测2024–2029年CAGR 53.7%
超大规模资本支出：2025年全球云厂商AI基础设施支出超3,800亿美元；2025年中国AI资本支出约910亿美元（互联网400亿+国企200亿+地方政府150亿）

技术演进路线

技术路线

阶段 01

EDA: Synopsys (SNPS)

Cadence (CDNS)

材料

国际

国产

昇腾1

昇腾2

国产成熟

云端

国产云

阶段 02

材料[硅晶圆: Sumco (3436.T)

光刻: ASML (ASML)]

国际[NVIDIA (NVDA)

国际路线]

国产[国产路线]

Hopper H100/H200

CUDA FP32 (2022)

昇腾1[昇腾910B (7nm, 2023)

寒武纪思元370 (688256, 7nm)]

昇腾2[国产Chiplet设计

昇腾920 (预计2025) · CANN生态]

国产成熟[国产生态成熟

CANN/兼容ROCm · 2027年国产化率55%目标]

云端[云服务: AWS (AMZN)

Azure (MSFT), GCP (GOOGL)]

国产云[国产云: 华为云

阿里云 (BABA)]

应用[AI训练/推理

大模型应用]

应用

阶段 03

Blackwell GB200 NVL72

FP8/FP4, NVLink5.0 · 台积电 (TSM) 4nm (2024)

阶段 04

Rubin架构

台积电 (TSM) 2nm (2026E)

原始图谱

flowchart LR
  subgraph 材料端
    EDA["EDA: Synopsys (SNPS)<br/>Cadence (CDNS)"] --> 材料["硅晶圆: Sumco (3436.T)<br/>光刻: ASML (ASML)"]
  end
  subgraph 设计与制造
    材料 --> 国际[NVIDIA (NVDA)<br/>国际路线]
    材料 --> 国产[国产路线]
    国际 --> H100["Hopper H100/H200<br/>CUDA FP32 (2022)"]
    H100 --> Blackwell["Blackwell GB200 NVL72<br/>FP8/FP4, NVLink5.0<br/>台积电 (TSM) 4nm (2024)"]
    Blackwell --> Rubin["Rubin架构<br/>台积电 (TSM) 2nm (2026E)"]
    国产 --> 昇腾1["昇腾910B (7nm, 2023)<br/>寒武纪思元370 (688256, 7nm)"]
    昇腾1 --> 昇腾2["国产Chiplet设计<br/>昇腾920 (预计2025)<br/>CANN生态"]
    昇腾2 --> 国产成熟["国产生态成熟<br/>CANN/兼容ROCm<br/>2027年国产化率55%目标"]
  end
  subgraph 应用
    国际 --> 云端["云服务: AWS (AMZN)<br/>Azure (MSFT), GCP (GOOGL)"]
    国产成熟 --> 国产云["国产云: 华为云<br/>阿里云 (BABA)"]
    云端 --> 应用["AI训练/推理<br/>大模型应用"]
    国产云 --> 应用
  end

AI加速芯片的技术演进正沿着两条主线展开。国际路线以NVIDIA (NVDA) 为绝对主导，代际跃迁节奏紧密。2022年的Hopper架构（H100/H200）凭借台积电 (TSM) 4nm工艺与CUDA FP32精度，开启大模型千卡集群训练时代；2024年量产的Blackwell架构（GB200 NVL72）进一步迈入FP8/FP4混合精度，配合NVLink 5.0互联，单机架算力密度实现数量级提升，驱动NVIDIA FY2025数据中心营收飙升至1,152亿美元（+142% YoY），占据数据中心GPU约80–90%份额。路线图已指向2026E的Rubin架构，预计将率先采用台积电2nm工艺，持续巩固算力霸权。

国产路线在先进工艺受限下走出差异化迭代路径。2023年量产的昇腾910B与寒武纪(688256)思元370坚守7nm节点，算力与同期Hopper存在代差；下一跳转向Chiplet设计，代表作为预计2025年登场的昇腾920，叠加CANN生态补课，试图在系统层面缩小差距。2027年国产化率目标达到55%，当前华为昇腾已在国产市场占据约23%份额。云端部署上，国际链依赖AWS (AMZN)、Azure (MSFT)、GCP (GOOGL)，国产链则通过华为云、阿里云 (BABA) 向大模型训练与推理输送算力，双轨并行的生态对垒已全面形成。

产业价值链结构

价值链

上游 EDA与IP

Synopsys(SNPS) Cadence(CDNS) · ARM(ARM) 2024

中游 AI芯片设计

NVIDIA(NVDA) AMD(AMD) · 华为海思寒武纪(688256)

下游 晶圆代工与封装

台积电(TSM) 3nm/5nm · 中芯国际(688981) N+1/7nm-like

下游 系统集成

ODM: 富士康广达 · DGX/HGX 整机柜

下游 云与算力服务

AWS Azure GCP · 国内智算中心(鹏城云脑)

终端 终端应用

大模型训练/推理 · 自动驾驶智慧城市

原始图谱

flowchart LR
  A[EDA与IP
Synopsys(SNPS) Cadence(CDNS)
ARM(ARM) 2024] --> B[AI芯片设计
NVIDIA(NVDA) AMD(AMD)
华为海思 寒武纪(688256)]
  B --> C[晶圆代工与封装
台积电(TSM) 3nm/5nm
中芯国际(688981) N+1/7nm-like]
  C --> D[系统集成
ODM: 富士康 广达
DGX/HGX 整机柜]
  D --> E[云与算力服务
AWS Azure GCP
国内智算中心(鹏城云脑)]
  E --> F[终端应用
大模型训练/推理
自动驾驶 智慧城市]

全球 AI 加速芯片产业链自上而下由 EDA与IP、AI芯片设计、晶圆代工与先进封装、系统集成、云与算力服务 到 终端应用 构成。最上游的 EDA 工具与 IP 授权由 Synopsys（SNPS）、Cadence（CDNS） 和 ARM（ARM） 高度垄断，为所有 AI 芯片设计提供不可或缺的架构基础和验证平台。迈入芯片设计环节，NVIDIA（NVDA） 凭借 CUDA 软件生态和 H100/H200/B200 等产品系列占据数据中心 AI GPU 约 80–90% 份额，牢牢锁定价值核心；AMD（AMD） 加速追赶，而 华为海思、寒武纪（688256） 则肩负国产替代任务，其中华为昇腾国产市占率已达约 23%，同期国产化率约 30% 正在向 40% 以上爬升。

晶圆代工与先进封装 是物理实现的关键隘口，台积电（TSM） 的 3nm/5nm 制程及 CoWoS 先进封装产能直接决定 AI 芯片的出货节奏，中芯国际（688981） 则依托 N+1/7nm-like 工艺支撑国内设计公司的生产需求，但先进制程仍受制约。系统集成环节由 富士康、广达 等 ODM 与 NVIDIA DGX/HGX 整机柜方案串联成最终算力硬件。再往下的 云与算力服务 层，全球以 AWS、Azure、GCP 三大公有云为首，国内以 鹏城云脑 为代表的智算中心正密集投建，2025 年全球云厂商 AI 基础设施支出预计超 3,800 亿美元，成为连接上游硬件与终端用户的核心枢纽。

整个价值链利润向上游 AI芯片设计 与 晶圆代工 高度集中，NVIDIA 与台积电分别占据设计与制造环节的定价权。国产替代的主战场当前聚焦于芯片设计，但制造环节的自主能力仍是长期瓶颈；下游云服务与智算中心通过大规模资本开支消化高昂芯片成本，最终向 大模型训练与推理、自动驾驶、智慧城市 等终端场景释放算力，需求爆发持续牵引全链条扩张。

重点公司

本土龙头

寒武纪（688256.SH） — A股AI芯片龙头，思元590系列；2025H1营收28.81亿元（+4,348% YoY），首次扭亏为盈；市值约2,800–3,000亿元；主要客户为运营商、城市智算中心
海光信息（688041.SH） — 国产AI芯片营收规模最大、盈利最强的上市公司；深算系列DCU（ROCm兼容架构，CUDA迁移成本最低）；2025H1营收54.64亿元（+45.2%），净利润12.01亿元（+40.8%）；与中科曙光形成"芯片+整机"战略组合
摩尔线程（688795.SH） — 2025年12月科创板上市，首日市值>3,000亿元；MTT S80/S4000系列GPU，新一代"平湖"架构；2025H1营收7.02亿元；创始人张建中为NVIDIA中国区前负责人
沐曦股份（688802.SH） — 国产 GPU 科创板上市标的；BF16/INT8 训练 + 推理双线产品；CUDA/ROCm 兼容生态
壁仞科技（06082.HK） — 2026-01-02 港股 18C 章特专科技公司机制上市，"港股 GPU 第一股"；首日开盘暴涨 118% 市值破 1000 亿港元；发行价 19.60 港元、募资 55.83 亿港元；BR100/BR104 系列自研通用 GPU；受美国实体清单约束；2026 港股首只新股
天数智芯（9903.HK） — 港股已上市国产 GPU；天垓 100/150 系列训练 + 推理芯片；与寒武纪/沐曦/壁仞/摩尔线程同梯队
华为昇腾（未上市）— 国产AI芯片绝对领军者，国产市占率约23%；Ascend 910B/910C；2024年出货超64万片；CANN软件栈+MindSpore框架+昇腾AI云服务全栈布局；20多个城市智算中心占据79%份额；先进制程依赖中芯国际7nm
燧原科技（未上市，IPO辅导中）— 云燧T20/T21训练芯片+i20推理芯片；腾讯为第一大股东（持股20.49%，连续6轮投资）；估值约205亿元；已在上海证监局完成上市辅导备案（中金公司辅导）

海外对标

NVIDIA（NVDA） — 全球AI算力绝对霸主；H100/B200/GB200系列；FY2025数据中心营收1,152亿美元（+142%）；CUDA生态400万+开发者是最深护城河；2025年以约200亿美元收购Groq资产（AI推理芯片，史上最大并购）；市值约3.2万亿美元
AMD（AMD） — NVIDIA最有力挑战者；MI300X拥有192GB HBM3E内存和5.3 TB/s带宽，大模型推理具有成本优势；与OpenAI签署6GW战略合作；ROCm生态快速改善
Google TPU Trillium / AWS Trainium2 — 超大规模云厂商自研ASIC，"去NVIDIA化"战略；Annapurna Labs（2015年被Amazon收购）是AWS芯片研发核心团队；Broadcom为Google TPU核心ASIC设计合作伙伴

未升格公司清单

留作行业全景参考，未单独建 note。出现重大催化时考虑升格。

Cerebras Systems（未上市，估值230亿美元，WSE-3晶圆级引擎）
Tenstorrent（未上市，估值约30–32亿美元，RISC-V AI加速器，Jim Keller主导）

景气度判断

当前景气度（描述性） 信号源：寒武纪海光信息摩尔线程财报；Bloomberg Intelligence；Bernstein研究

景气度极高，处于AI算力超级周期中。2025年全球云厂商AI基础设施资本支出超3,800亿美元，中国AI资本支出910亿美元，需求端极为旺盛。国产化率加速提升（30%→42%）。主要风险：NVIDIA CUDA生态护城河短期难以超越；中国先进制程受限导致国产芯片性能落差持续；国产AI芯片IPO估值普遍极高（寒武纪PE数百倍），泡沫风险大。

风险提示

关键风险

CUDA生态护城河：NVIDIA 20年积累的CUDA软件生态（400万+开发者、3,000+优化应用）是短期内无法复制的竞争壁垒；国内软件生态（CANN/ROCm/Cambricon）成熟度差距制约国产替代速度

先进制程受限+估值泡沫：中国AI芯片厂商依赖中芯国际7nm，与台积电3nm/2nm的性能差距持续扩大；国产AI芯片上市公司（寒武纪、摩尔线程）估值极高（市值/营收比数十至数百倍），业绩不达预期时回调风险极大