L4 模型层

全球前沿与中国大模型

当前核心信号:2025-12-26

一句话判断

全球前沿与中国大模型 是 L4 模型层中连接上游供给、产业约束和下游 AI 需求的关键环节,当前主要观察 基础大模型竞争进入能力趋同和价格战阶段,算力供给、推理成本、开源生态和商业化场景决定模型公司分化。

关键瓶颈 基础大模型竞争进入能力趋同和价格战阶段,算力供给、推理成本、开源生态和商业化场景决定模型公司分化
代表公司 3 家
内容状态 部分填充

核心约束

先看卡点
基础大模型竞争进入能力趋同和价格战阶段,算力供给、推理成本、开源生态和商业化场景决定模型公司分化

2025-12-26

代表公司

3 家

近期催化

1 条

研究笔记

来自 Obsidian

全球前沿与中国大模型

关键信息摘要

Key Highlights

  • 全球LLM市场2025年77.7亿美元→2026E 105.7亿美元(CAGR 34.4%);中国大模型市场2024年294亿元→2026E突破700亿元(CAGR 54%+)
  • OpenAI估值约3000亿美元,ChatGPT月活超4亿;DeepSeek以极低推理成本(每百万token仅2-4元)颠覆行业定价体系;智谱AI(2513.HK)2026年1月成为"大模型第一股"
  • 中国开发的开源模型全球市场份额从2024年底的1.2%飙升至2025年中的近30%,以Qwen、DeepSeek为代表
维度 核心数据
全球AI软件市场规模(2025) 约1,741亿美元,CAGR 25%
全球LLM市场规模(2025/2026E) 77.7亿美元 / 105.7亿美元,CAGR 34.4%
中国大模型市场规模(2024/2026E) 294亿元 / 700亿元+,CAGR 54%+
中国AI核心产业规模(2025) 超9,000亿元,企业数量超5,300家
重点上市标的 GOOGL、META、BABA(9988.HK)、0700.HK2513.HK
重点未上市公司 OpenAI(估值3000亿美元)、Anthropic(估值600亿美元)、DeepSeek、月之暗面

行业定义与边界

"模型工厂"(全球前沿与中国大模型部分)是AI产业链的核心引擎层。本细分覆盖全球前沿基础大语言模型(§2.1)、中国AI六小龙(§2.2)以及中国互联网大厂模型(§2.3)。

从产业链视角:上游为芯片/数据中心/训练数据,下游为API调用、推理服务、AI应用。核心功能是将海量数据与算力转化为可用智能,是AI产业链的技术高地。

竞争结构:全球约5-7家前沿实验室(OpenAI、Anthropic、Google DeepMind、Meta AI、xAI、DeepSeek、阿里通义)构成第一梯队,预训练前沿模型成本已达数亿美元,形成极高壁垒。中国互联网大厂(百度、阿里、腾讯、字节、华为)构成第二梯队。

市场规模与增长

全球市场

  • 全球大语言模型(LLM)市场(2025):77.7亿美元,预计2026年达105.7亿美元,2035年达1,498.9亿美元,CAGR 34.4%
  • 全球生成式AI市场(2024):371亿美元,预计2030年达2,200亿美元,CAGR 29%
  • 2025年全球企业在生成式AI上的支出达370亿美元,较2024年的115亿美元增长3.2倍

中国市场

  • 中国大模型市场规模:2024年294.16亿元,预计2025年495.39亿元,2026年突破700亿元,2028年达1,179亿元,CAGR约33.5%
  • 中国AI核心产业规模(2025年9月):超9,000亿元,企业数量超5,300家,占全球约15%
  • 中国开源模型全球市场份额从2024年底的1.2%飙升至2025年中的近30%

技术演进路线

技术路线
阶段 01
上游环节
阶段 02
中游环节
阶段 03
下游环节
原始图谱
flowchart LR
  上游环节 --> 中游环节 --> 下游环节

产业价值链结构

价值链
上游 原材料
中游 制造
终端 客户
原始图谱
flowchart LR
  原材料 --> 制造 --> 客户

重点公司

本土龙头

  • DeepSeek/深度求索(未上市):2025年初以R1模型震动全球AI界,推理成本每百万token仅2-4元,颠覆行业定价体系。母公司幻方量化承担资金,坚持不融资不上市策略。技术论文引用量超过同期OpenAI。
  • 智谱AI(2513.HK:2026年1月成功在港交所挂牌,成为"大模型第一股"。市值约400亿元。2024年总营收约4200万美元,预计2025年增长4倍至约1.68亿美元。GLM系列模型覆盖通用对话、代码、多模态等。
  • 月之暗面/Moonshot AI(未上市):估值33-40亿美元,Kimi系列模型以长上下文处理能力著称。2025年7月发布万亿参数模型Kimi K2并开源,在多项基准测试中超越GPT-5、Claude 4.5。
  • 阿里 通义千问 Qwen(9988.HK:Qwen在全球开源模型排行榜稳居前三,与Llama形成"东西双雄"格局。阿里市值约2.8万亿港元。
  • 字节跳动 豆包(未上市):据报道估值约3000亿美元,凭借抖音/TikTok生态和强大推荐算法,豆包迅速崛起为中国C端AI产品用户量最大平台之一。
  • 腾讯 混元(0700.HK:市值约4.8万亿港元,凭借微信生态海量用户基础,混元模型C端渗透率具有独特优势。
  • 百度 文心(9888.HK:中国最早推出大模型的互联网公司之一,文心一言API调用量超行业前列。市值约2700亿港元。

海外对标

  • OpenAI(未上市):估值约3000亿美元(2025年10月融资后),ChatGPT月活跃用户超4亿,年化收入预估超100亿美元。GPT-4o/o3系列、Sora视频生成、Codex代码Agent。
  • Anthropic(未上市):估值约600亿美元(2025年中),Claude系列模型,被视为OpenAI最强竞争对手。亚马逊累计投资超80亿美元。Claude Code年化收入超25亿美元。
  • Google DeepMind — Gemini(GOOGL):市值约2.05万亿美元,Gemini 2.5系列深度整合至Google全线产品,Google Cloud年收入约440亿美元。
  • Meta AI — Llama(META):市值约1.65万亿美元,Llama 4开源模型累计下载量超10亿次,构建全球最大开源AI社区生态。
  • xAI — Grok(未上市):估值约500亿美元,Grok系列模型深度整合X(原Twitter)平台。

未升格公司清单

留作行业全景参考,未单独建 note。出现重大催化时考虑升格。

  • 华为 盘古(未上市):聚焦行业赋能(政务、矿山、气象),与昇腾AI芯片形成软硬协同,在政务和央企市场具有独特优势
  • MiniMax(0100.HK):聚焦社交AI与角色扮演,2025年已在港交所上市
  • 百川智能(未上市)、零一万物(未上市):已逐步放弃死磕基座大模型,转向应用层
  • 阶跃星辰/StepFun:中国大模型第一梯队"四小龙"之一,坚持基座大模型研发

景气度判断

当前景气度(描述性) 信号源:

推理模型崛起,DeepSeek-R1以极低推理成本实现接近GPT-4性能,迫使全球模型厂商重新思考训练效率与推理优化优先级。2026年推理时计算(Inference-time Compute)、强化学习驱动的推理链优化成为技术主线,导致"模型成本急速下降,应用层加速繁荣"。

智谱AI港股上市(2026年1月)打通了中国大模型企业的资本化路径,港股18C章为后续大模型IPO提供了可验证的模板。

风险提示

关键风险

  • 大模型能力快速趋同("同质化"风险),API价格战持续,商业化变现路径不清晰;大部分大模型公司仍处于烧钱阶段
  • 中美地缘政治风险:美国出口管制限制中国获取高端AI芯片,对中国前沿模型训练能力形成制约