DeepSeek

2025-12-26
技术突破 L4-05-全球前沿与中国大模型L4-12-模型部署与推理优化L4-10-开源生态与RAG与Agent 科大讯飞-002230商汤科技-0020.HK中科创达-300496
中性

影响行业

3 个

全球前沿与中国大模型

基础大模型竞争进入能力趋同和价格战阶段,算力供给、推理成本、开源生态和商业化场景决定模型公司分化

部分填充 L4 2025-12-26

开源生态与RAG与Agent

开源模型、RAG和Agent框架加速企业AI落地,但SDK框架被低代码平台和大模型原生能力挤压,商业化路径仍待验证

部分填充 L4 2025-12-26

模型部署与推理优化

推理负载成为AI算力主战场,模型压缩、服务编排、成本下降和云厂商低价策略决定独立推理服务商利润

部分填充 L4 2025-12-26

相关公司

3 家

商汤科技 16

AI基础设施(算力服务)构建护城河 + 行业渗透与平台化

L4-12 已完成 2025-12-26

中科创达 300496

软件定义汽车深化 + 端侧AI与操作系统生态

L4-12 已完成 2025-12-26

科大讯飞 1176

构建“星火”大模型产业生态,从工具提供商升级为平台运营商 + 认知智能技术红利期,在教育、医疗、汽车等高价值场景持续渗透

L4-06 已完成 2026-04-28

2025-12-26 DeepSeek V3 发布

事件描述

DeepSeek 发布 V3 大模型:

  • 671B 参数 MoE 架构(37B 激活)
  • 性能在多项 benchmark 逼近 GPT-4o
  • 训练成本仅 558 万美元(同档模型仅为 1/10)
  • 完整开源 base 和 instruct 模型权重
  • API 价格 RMB 1 / 100 万 token,比 GPT-4o 便宜 90%+

影响判断

双重影响 — 不简单是利好 利好

  • 中国开源大模型生态:魔搭 / Hugging Face 中国 community 受益
  • 推理优化层(中科创达 / 商汤 / 瑞芯微 / 硅基流动):token 成本暴跌 → 推理量爆炸 → 推理基础设施需求激增
  • A 股 AI 应用层:垂直 SaaS 公司(科大讯飞、金山办公、卫宁健康等)API 成本下降,毛利改善

利空(或中性)

  • 训练 capex 节奏不确定:如果同等性能可用更少算力达成,对 GPU 需求曲线可能调整(但巨头仍需顶级算力做 frontier model)
  • 商业化压力:闭源大模型公司利润空间受挤压

A 股结论:偏推理优化方向利好,训练 GPU 链中性,应用层利好。

信息源

  • DeepSeek 官网 / GitHub(V3 技术报告)
  • Hugging Face DeepSeek-V3 模型页