DeepSeek

2025-12-26

技术突破 L4-05-全球前沿与中国大模型L4-12-模型部署与推理优化L4-10-开源生态与RAG与Agent 科大讯飞-002230商汤科技-0020.HK中科创达-300496

中性

影响行业

3 个

全球前沿与中国大模型

基础大模型竞争进入能力趋同和价格战阶段，算力供给、推理成本、开源生态和商业化场景决定模型公司分化

部分填充 L4 2026-06-08

开源生态与RAG与Agent

开源模型、RAG和Agent框架加速企业AI落地，但SDK框架被低代码平台和大模型原生能力挤压，商业化路径仍待验证

部分填充 L4 2026-06-01

模型部署与推理优化

推理负载成为AI算力主战场，模型压缩、服务编排、成本下降和云厂商低价策略决定独立推理服务商利润

部分填充 L4 2026-05-27

2025-12-26 DeepSeek V3 发布

事件描述

DeepSeek 发布 V3 大模型：

671B 参数 MoE 架构（37B 激活）
性能在多项 benchmark 逼近 GPT-4o
训练成本仅 558 万美元（同档模型仅为 1/10）
完整开源 base 和 instruct 模型权重
API 价格 RMB 1 / 100 万 token，比 GPT-4o 便宜 90%+

影响判断

双重影响 — 不简单是利好 利好

中国开源大模型生态：魔搭 / Hugging Face 中国 community 受益

推理优化层（中科创达 / 商汤 / 瑞芯微 / 硅基流动）：token 成本暴跌 → 推理量爆炸 → 推理基础设施需求激增

A 股 AI 应用层：垂直 SaaS 公司（科大讯飞、金山办公、卫宁健康等）API 成本下降，毛利改善

利空（或中性）

训练 capex 节奏不确定：如果同等性能可用更少算力达成，对 GPU 需求曲线可能调整（但巨头仍需顶级算力做 frontier model）

商业化压力：闭源大模型公司利润空间受挤压

A 股结论：偏推理优化方向利好，训练 GPU 链中性，应用层利好。

信息源

DeepSeek 官网 / GitHub（V3 技术报告）
Hugging Face DeepSeek-V3 模型页

DeepSeek

影响行业

全球前沿与中国大模型

开源生态与RAG与Agent

模型部署与推理优化

相关公司

商汤科技 0020

中科创达 300496

科大讯飞 002230

2025-12-26 DeepSeek V3 发布

事件描述

影响判断

信息源