L4 模型层

开源生态与RAG与Agent

当前核心信号:2025-12-26

一句话判断

开源生态与RAG与Agent 是 L4 模型层中连接上游供给、产业约束和下游 AI 需求的关键环节,当前主要观察 开源模型、RAG和Agent框架加速企业AI落地,但SDK框架被低代码平台和大模型原生能力挤压,商业化路径仍待验证。

关键瓶颈 开源模型、RAG和Agent框架加速企业AI落地,但SDK框架被低代码平台和大模型原生能力挤压,商业化路径仍待验证
代表公司 1 家
内容状态 部分填充

核心约束

先看卡点
开源模型、RAG和Agent框架加速企业AI落地,但SDK框架被低代码平台和大模型原生能力挤压,商业化路径仍待验证

2025-12-26

代表公司

1 家

近期催化

1 条

研究笔记

来自 Obsidian

开源生态与RAG与Agent

RAG 与 Agent 生态视觉图

关键信息摘要

Key Highlights

  • 全球模型生态与工具链市场(2024)约80-100亿美元→(2026E)约250-320亿美元;AI Agent市场(2025)76亿美元→(2030)471亿美元(CAGR 45.8%)
  • Hugging Face估值45亿美元,ARR约7000万美元(增速367%),被誉为"AI界的GitHub";Cloudflare收购Replicate(2025年11月),边缘AI推理战略整合
  • Dify(低代码Agent平台,GitHub 55K+ Stars)、Coze/扣子(字节)是中国LLM开发平台的头部玩家;LangChain估值12.5亿美元
项目 内容
全球市场规模(2024) 约80-100亿美元(含模型API、开发工具链、Agent框架、安全工具)
全球市场规模(2026E) 约250-320亿美元
中国市场规模(2024) 约150-200亿元人民币
中国市场规模(2026E) 约500-650亿元人民币
CAGR(2024-2028) 35%-45%
核心驱动力 开源模型爆发、Agent范式兴起、企业AI落地提速
代表企业 Hugging Face、Together AI、LangChain、Dify、Coze(扣子)

行业定义与边界

开源模型生态与RAG/Agent框架是围绕AI基础模型构建的中间层产业,处于基础模型(Foundation Model)和终端AI应用之间的关键连接位置。核心使命是降低大模型使用门槛,提升模型在实际业务场景中的可用性、安全性和工程化水平。

  1. 开源模型生态/模型市场:提供模型的托管、分发、搜索、评测和运行环境,类似AI领域的"GitHub+NPM"。代表:Hugging Face、魔搭社区、Together AI、Replicate(已被Cloudflare收购)、Ollama。

  2. RAG/Agent框架:为开发者和企业提供连接大模型与外部数据、工具、流程的编排层。包括SDK型框架(LangChain、LlamaIndex)、低代码/可视化平台(Dify、Coze/扣子、FastGPT)以及多Agent协作框架(CrewAI)。

行业边界:该行业不直接训练大规模基础模型,但为模型的分发、编排、应用和安全提供不可或缺的基础设施。上游延伸至基础模型训练,下游衔接垂直行业AI应用。

市场规模与增长

全球市场

  • 模型API与推理市场:从2023年的35亿美元快速增长至2025年的约84亿美元,预计2026年将突破120亿美元
  • AI Agent市场:2025年全球76亿美元,预计2030年增长至471亿美元(CAGR 45.8%)
  • AI开发工具市场(2024):约60-70亿美元,CAGR 23%+,到2026年有望达到100-120亿美元

综合以上细分,2024年全球模型生态与工具链市场总规模约为80-100亿美元,预计2026年达到250-320亿美元。

中国市场

以魔搭社区、Dify、Coze等为代表的中国平台在开发者数量和模型部署量上均实现倍增。中国开源模型(Qwen系列、DeepSeek等)在全球开源社区的影响力从2024年下半年开始显著提升。估计2024年中国市场规模约150-200亿元,2026年有望达到500-650亿元。

技术演进路线

技术路线
阶段 01
上游环节
阶段 02
中游环节
阶段 03
下游环节
原始图谱
flowchart LR
  上游环节 --> 中游环节 --> 下游环节

产业价值链结构

价值链
上游 原材料
中游 制造
终端 客户
原始图谱
flowchart LR
  原材料 --> 制造 --> 客户

重点公司

本土龙头

  • 魔搭社区 ModelScope(阿里巴巴旗下):中国最大的开源模型社区,由阿里云达摩院运营。托管数千个模型,深度集成阿里云基础设施,是Qwen系列模型的首发平台。中国市场模型托管平台的事实标准。
  • Dify(未上市):开源LLM应用开发平台,支持20+主流大模型动态切换,提供低代码可视化开发环境。GitHub Star超55K,2024-2025年增长最快的LLM开发平台之一,估值约3-5亿美元。
  • Coze/扣子(字节跳动旗下):低代码AI智能体开发平台,周访问量超64万,依托字节跳动流量快速获客,与豆包大模型深度集成。
  • FastGPT(开源):集知识库管理、RAG检索和Agent能力于一体的开源平台,特别适合需要私有化部署的中国企业客户。

海外对标

  • Hugging Face(未上市):全球最大AI模型开源社区与托管平台,超过100万个模型、数据集和应用。估值约45亿美元(2023年8月D轮后),ARR约7000万美元(同比增速367%)。Transformers库GitHub 121K+ Stars。投资者:Google、Amazon、NVIDIA、Salesforce等。
  • Together AI(未上市):开源模型推理与训练云平台龙头,估值33亿美元(2025年2月B轮后),ARR约3亿美元(2025年9月)。
  • LangChain(未上市):LLM编排框架先行者,估值12.5亿美元(2025年10月B轮后),GitHub 118K+ Stars。产品矩阵包括LangChain、LangGraph、LangSmith。
  • LlamaIndex(未上市):RAG领域专精框架,100+数据连接器,在知识密集型应用中表现卓越。

未升格公司清单

留作行业全景参考,未单独建 note。出现重大催化时考虑升格。

  • Replicate(已被Cloudflare收购,2025年11月):无服务器GPU推理平台,Cloudflare借此强化边缘AI推理能力,将AI推理纳入CDN网络
  • Ollama(开源):本地大模型运行工具,开发者社区极高知名度,仅融资12.5万美元但影响力与投入严重不对等
  • Modal(未上市):无服务器AI/ML云基础设施平台,估值约10亿美元
  • Weights & Biases(未上市):ML实验跟踪和模型管理MLOps平台,估值约8.7亿美元
  • CrewAI(未上市):多Agent编排框架,声称服务60%财富500强,融资1800万美元
  • AutoGen/Microsoft Agent Framework:微软统一Agent开发框架,深度集成Azure生态
  • 百度心响/文心智能体平台:百度推出的智能体开发平台
  • 腾讯元器:腾讯AI智能体开发平台,深度集成微信生态
  • RAGFlow(无穷流科技):开源深度文档理解和RAG引擎,2024-2025年中国开源RAG领域新星

景气度判断

当前景气度(描述性) 信号源:

Agent框架是2025-2026年增长最快的细分。从SDK型框架(LangChain)到低代码平台(Dify、Coze)的范式迁移正在发生,市场需求从"开发者工具"向"企业生产力工具"演进。

Cloudflare收购Replicate(2025年11月)是大厂整合生态的典型案例,将AI推理能力嵌入已有CDN网络。Gartner预测到2028年33%的企业软件将包含Agent AI,驱动整个工具链生态的持续扩展。

风险提示

关键风险

  • LangChain等SDK型框架面临来自低代码平台和大模型厂商原生能力的双重挤压,先发优势可能迅速丧失
  • 开源商业化模式(Red Hat模式)在中国资本市场认可度尚待验证,Dify等开源项目的营收规模化路径不清晰