Key Highlights

全球LLM市场2025年77.7亿美元→2026E 105.7亿美元（CAGR 34.4%）；中国大模型市场2024年294亿元→2026E突破700亿元（CAGR 54%+）

OpenAI估值约3000亿美元，ChatGPT月活超4亿；DeepSeek以极低推理成本（每百万token仅2-4元）颠覆行业定价体系；智谱AI（2513.HK）2026年1月成为"大模型第一股"

中国开发的开源模型全球市场份额从2024年底的1.2%飙升至2025年中的近30%，以Qwen、DeepSeek为代表

维度	核心数据
全球AI软件市场规模（2025）	约1,741亿美元，CAGR 25%
全球LLM市场规模（2025/2026E）	77.7亿美元 / 105.7亿美元，CAGR 34.4%
中国大模型市场规模（2024/2026E）	294亿元 / 700亿元+，CAGR 54%+
中国AI核心产业规模（2025）	超9,000亿元，企业数量超5,300家
重点上市标的	纯主营基础大模型: 2513.HK (智谱) / 0100.HK (MiniMax); 海外: GOOGL / META / MSFT
重点未上市公司	OpenAI（估值3000亿美元）、Anthropic（估值600亿美元）、DeepSeek、月之暗面

行业定义与边界

"模型工厂"（全球前沿与中国大模型部分）是AI产业链的核心引擎层。本细分覆盖全球前沿基础大语言模型（§2.1）、中国AI六小龙（§2.2）以及中国互联网大厂模型（§2.3）。

从产业链视角：上游为芯片/数据中心/训练数据，下游为API调用、推理服务、AI应用。核心功能是将海量数据与算力转化为可用智能，是AI产业链的技术高地。

竞争结构：全球约5-7家前沿实验室（OpenAI、Anthropic、Google DeepMind、Meta AI、xAI、DeepSeek、阿里通义）构成第一梯队，预训练前沿模型成本已达数亿美元，形成极高壁垒。中国互联网大厂（百度、阿里、腾讯、字节、华为）构成第二梯队。

市场规模与增长

全球市场

全球大语言模型（LLM）市场（2025）：77.7亿美元，预计2026年达105.7亿美元，2035年达1,498.9亿美元，CAGR 34.4%
全球生成式AI市场（2024）：371亿美元，预计2030年达2,200亿美元，CAGR 29%
2025年全球企业在生成式AI上的支出达370亿美元，较2024年的115亿美元增长3.2倍

中国市场

中国大模型市场规模：2024年294.16亿元，预计2025年495.39亿元，2026年突破700亿元，2028年达1,179亿元，CAGR约33.5%
中国AI核心产业规模（2025年9月）：超9,000亿元，企业数量超5,300家，占全球约15%
中国开源模型全球市场份额从2024年底的1.2%飙升至2025年中的近30%

技术演进路线

全球前沿大模型技术正从"参数竞赛"全面转向"推理效率与多模态融合"。2023年以GPT-4为代表的稠密万亿参数预训练路线拉开序幕，2024年开源模型（Llama 3、Qwen 2）逐步追平闭源能力，2025年DeepSeek-R1以"极低推理成本+强化学习推理链"改写定价体系，2026年推理时计算（Inference-time Compute）和Agent能力成为主战场。

技术路线

阶段 01

稠密预训练基座

2023年 GPT-4

阶段 02

开源模型追平闭源

2024年 Llama 3 / Qwen 2

阶段 03

强化学习推理链优化

2025年 DeepSeek-R1 · API成本降至2-4元/百万token

阶段 04

中国开源模型份额飙升

2024年底1.2%→2025年中30% · Qwen/DeepSeek系列主导

阶段 05

多模态与Agent能力

2026年主战场 · MiniMax视频生成（比肩Sora）

阶段 06

资本市场确认

2026年6月恒生科技指数纳入 · 智谱AI（2513.HK）MiniMax（0100.HK）

原始图谱

flowchart LR
    A["稠密预训练基座\n2023年 GPT-4"] --> B["开源模型追平闭源\n2024年 Llama 3 / Qwen 2"]
    B --> C["强化学习推理链优化\n2025年 DeepSeek-R1\nAPI成本降至2-4元/百万token"]
    C --> D["中国开源模型份额飙升\n2024年底1.2%→2025年中30%\nQwen/DeepSeek系列主导"]
    D --> E["多模态与Agent能力\n2026年 主战场\nMiniMax视频生成（比肩Sora）\n智谱AutoGLM跨应用Agent"]
    E --> F["资本市场确认\n2026年6月 恒生科技指数纳入\n智谱AI（2513.HK）MiniMax（0100.HK）"]

关键节点说明：2024年底中国开源模型全球市场份额仅1.2%，至2025年中飙升至近30%（Qwen/DeepSeek系列主导）。DeepSeek-R1以每百万token 2-4元的推理成本推动行业"价格战"，迫使Google Gemini、OpenAI GPT-4o大幅降价。2026年6月恒生科技指数首次纳入大模型纯主营公司智谱AI（2513.HK）与MiniMax（0100.HK），标志着资本市场对模型工厂独立商业价值的确认。多模态与Agent能力成为2026年差异化焦点——MiniMax在视频生成领域性能比肩Sora，智谱AutoGLM完成跨应用Agent任务闭环。

产业价值链结构

大模型产业价值链从上游高端算力与数据，经中游"模型工厂"训练与推理，延伸至下游API服务、行业Agent与终端应用。2025年全球企业在生成式AI上的支出达370亿美元（同比+3.2倍），中国大模型市场2026年突破700亿元（CAGR 54%）。

价值链

上游 高端训练/推理芯片英伟达H200/B200出口管制国产昇腾910B 2026E效率达H100的60-70%

中游 算力云华为云/阿里云部署昇腾910B

下游 基座大模型训练与迭代智谱AI-2513.HK / DeepSeek / MiniMax-0100.HK

下游 模型即服务MaaS/推理API API均价降90%以上

终端 垂类Agent与行业应用盛视科技002990.SZ 智慧口岸大模型拓尔思300229.SZ 媒体/政务NLP …

原始图谱

flowchart LR
    A[高端训练/推理芯片 英伟达H200/B200出口管制 国产昇腾910B 2026E效率达H100的60-70%] --> B[算力云 华为云/阿里云部署昇腾910B]
    B --> C[基座大模型训练与迭代 智谱AI-2513.HK / DeepSeek / MiniMax-0100.HK]
    C --> E[模型即服务MaaS/推理API API均价降90%以上]
    E --> F[垂类Agent与行业应用 盛视科技002990.SZ 智慧口岸大模型 拓尔思300229.SZ 媒体/政务NLP 单客户年付费规模突破百万元]

价值链关键特征：上游算力供给仍受美国出口管制限制（英伟达高端芯片断供），但国产昇腾910B已在华为云、阿里云规模部署，2026年国产AI芯片训练效率达H100的60-70%。中游模型层竞争白热化，智谱AI（2513.HK）、MiniMax（0100.HK）成功上市后打通资本化路径，2026年6月8日恒生科技指数纳入这两家公司进一步吸引被动资金；同时DeepSeek坚持不融资策略，以幻方量化资金支撑研发。下游应用层受益于API价格暴跌90%以上，智慧口岸（盛视科技002990.SZ）、政务NLP（拓尔思300229.SZ）等场景加速渗透，垂类Agent单客户年付费规模突破百万元。

重点公司

本土龙头

DeepSeek/深度求索（未上市）：2025年初以R1模型震动全球AI界，推理成本每百万token仅2-4元，颠覆行业定价体系。母公司幻方量化承担资金，坚持不融资不上市策略。技术论文引用量超过同期OpenAI。
智谱AI（2513.HK）：2026年1月成功在港交所挂牌，成为"大模型第一股"。市值约400亿元。2024年总营收约4200万美元，预计2025年增长4倍至约1.68亿美元。GLM系列模型覆盖通用对话、代码、多模态等。
月之暗面/Moonshot AI（未上市）：估值33-40亿美元，Kimi系列模型以长上下文处理能力著称。2025年7月发布万亿参数模型Kimi K2并开源，在多项基准测试中超越GPT-5、Claude 4.5。

关于互联网大厂自研大模型的说明 中国主要互联网大厂均有自研大模型作为内部能力（百度文心一言 / 阿里通义 Qwen / 腾讯混元 / 字节豆包 / 华为盘古），其中阿里云-BABA 已归 L3-01 云计算与智算平台、腾讯控股-00700 已归 L5-13 AI 游戏、百度-BIDU 已归 L5-09 AI 搜索（主营业务都不是大模型本身，是大厂的"AI 能力 + 主营生态"组合产品）；字节跳动未上市。本细分 L4-05 只独立建档主营 = 基础大模型的纯粹标的（如 MiniMax / 智谱 AI / DeepSeek / 月之暗面 / 阶跃星辰），互联网大厂自研模型作为 AI 产业链背景信息记录但不在本细分独立建公司笔记。

海外对标

OpenAI（未上市）：估值约3000亿美元（2025年10月融资后），ChatGPT月活跃用户超4亿，年化收入预估超100亿美元。GPT-4o/o3系列、Sora视频生成、Codex代码Agent。
Anthropic（未上市）：估值约600亿美元（2025年中），Claude系列模型，被视为OpenAI最强竞争对手。亚马逊累计投资超80亿美元。Claude Code年化收入超25亿美元。
Google DeepMind — Gemini（GOOGL）：市值约2.05万亿美元，Gemini 2.5系列深度整合至Google全线产品，Google Cloud年收入约440亿美元。
Meta AI — Llama（META）：市值约1.65万亿美元，Llama 4开源模型累计下载量超10亿次，构建全球最大开源AI社区生态。
xAI — Grok（未上市）：估值约500亿美元，Grok系列模型深度整合X（原Twitter）平台。

未升格公司清单

留作行业全景参考，未单独建 note。出现重大催化时考虑升格。

百川智能（未上市）、零一万物（未上市）：已逐步放弃死磕基座大模型，转向应用层
阶跃星辰/StepFun：中国大模型第一梯队"四小龙"之一，坚持基座大模型研发

Dashboard 已剔但产业链有效环节

本节说明 以下标的因交易维度 (PEG / 流动性 / 业绩兑现等) 在 stock-trading-dashboard 被 dropped, 但业务实质处于本细分 AI 产业链有效环节, 在此记录作为行业覆盖参考。各标的尚未单独建公司一页纸笔记, 未来按需补充 (见 00-总览/待办清单-反灌补全工作.md)。

拓尔思（300229） [A 类]
- 产业链定位：处于 L4-05 NLP/大模型应用产业链下游, 是国内最早布局自然语言处理的厂商之一, 在政务/媒体/金融垂类大模型领域有先发卡位, 属于国产 NLP 代表性老牌厂商.
- 业务介绍：公司主业为搜索引擎与 NLP 技术服务, 推出拓天大模型并落地政务/媒体/公安等垂直行业, 是国内 NLP 大模型应用层代表性厂商之一.
盛视科技（002990） [B 类]
- 产业链定位：处于 L4-05 大模型应用下游，主营智慧口岸 IT 集成，2024 年推出自研盛算多模态行业大模型并配套 11 亿元 IT 采购支撑算力，与科大讯飞-002230 / 云从科技-688327 等 AI 应用厂商相比定位差异化于口岸通关垂直场景。
- 业务介绍：公司主业为智慧口岸与边检通关系统集成，自研盛算多模态行业大模型覆盖人证核验、行李查验、车辆识别等口岸 AI 场景，是国内智慧口岸细分赛道的代表性厂商。

景气度判断

当前景气度（描述性） 信号源：

推理模型崛起，DeepSeek-R1以极低推理成本实现接近GPT-4性能，迫使全球模型厂商重新思考训练效率与推理优化优先级。2026年推理时计算（Inference-time Compute）、强化学习驱动的推理链优化成为技术主线，导致"模型成本急速下降，应用层加速繁荣"。

智谱AI港股上市（2026年1月）打通了中国大模型企业的资本化路径，港股18C章为后续大模型IPO提供了可验证的模板。

风险提示

关键风险

大模型能力快速趋同（"同质化"风险），API价格战持续，商业化变现路径不清晰；大部分大模型公司仍处于烧钱阶段

中美地缘政治风险：美国出口管制限制中国获取高端AI芯片，对中国前沿模型训练能力形成制约