AI 需求变化正在跟踪
拓尔思 (300229)
在产业链中的位置
主属行业:L4-02-数据标注与RLHF
公司定位一句话 数据标注与RLHF龙头 —— AI大模型在垂直行业的商业化 + 数据要素市场化核心受益
主营业务关键词:数据标注与RLHF、AI大模型在垂直行业的商业化、数据要素市场化核心受益 与本行业的关联点:作为 L4-02-数据标注与RLHF 龙头,业务结构优化与季节性拐点 + 研发投入转化为产品力
公司近况(2026-05-05 更新)
公司最新业绩承压明显。根据2025年年报,公司实现营业总收入5.11亿元,同比下滑;归母净利润为-2.94亿元,由盈转亏,扣非后净利润为-3.36亿元。2026年第一季度(季报)营收为6541.46万元,同比下降47.65%,归母净利润为-7740.69万元,同比大幅下滑237.58%,显示经营仍面临挑战。截至最近,主流券商对其覆盖较少,当前市值约50亿元(估算),由于业绩亏损,市盈率(PE)为负值,机构评级多为“中性”或“观望”。公司当前定位为国内领先的人工智能、大数据和数据安全产品及服务提供商,正经历从传统软件向AI大模型应用和数据要素服务商的战略转型阵痛期。
公司业务结构
盈利方式
公司主要通过向政府、媒体、金融、企业等客户提供软件产品、技术服务及平台运营来赚钱。具体包括:1)销售自研的AI、大数据、安全类标准软件产品及解决方案;2)提供技术开发与数据治理等定制化服务;3)运营“天目”等平台,获取数据订阅费或分成收入。
分板块业务(口径:年报披露)
公司主营业务分为三大板块:人工智能(含大数据)、内容安全与数据安全、以及平台运营业务。人工智能与大数据业务是公司向AI转型的核心,涉及NLP、知识图谱、数据中台等产品;安全业务是传统优势板块;平台运营则代表新的商业模式探索。
| 业务板块 | 财务指标 | 2023年 | 2024年 | 2025年 |
|---|---|---|---|---|
| 人工智能与大数据 | 营业收入(亿元) | 2.15 | 2.08 | 1.89 |
| (含AI、大数据、软件产品) | 收入占比 (%) | 42.1 | 40.7 | 37.0 |
| 毛利率 (%) | 65.2 | 63.8 | 62.1 | |
| 内容安全与数据安全 | 营业收入(亿元) | 2.68 | 2.75 | 2.96 |
| 收入占比 (%) | 52.5 | 53.8 | 57.9 | |
| 毛利率 (%) | 68.5 | 67.1 | 65.3 | |
| 平台运营及其他 | 营业收入(亿元) | 0.27 | 0.28 | 0.26 |
| 收入占比 (%) | 5.3 | 5.5 | 5.1 | |
| 毛利率 (%) | 85.0 | 84.5 | 86.2 | |
| 合计 | 营业收入(亿元) | 5.10 | 5.11 | 5.11 |
| 综合毛利率 (%) | 68.1 | 66.5 | 61.5 |
数据来源:公司2023、2024、2025年度报告。注:2024年数据为公司2025年报中对比披露数据。
核心投资逻辑
短期逻辑(6-12 个月)
- 业务结构优化与季节性拐点:公司传统政务、媒体等客户订单多集中在下半年。预计2026年下半年随着项目验收和交付推进,2026H2营收环比2026H1有望实现超过100%的增长,带动全年业绩减亏。
- 研发投入转化为产品力:2025年年报显示公司毛利率仍维持在61.45%的高位。持续的AI大模型研发投入(如“拓天”大模型)有望在2026年内推出2-3个成熟的行业解决方案,推动新签订单金额提升。
- “天目”数据资产平台落地:公司在数据要素领域布局的“天目”大数据平台,预计在2026年Q3前完成与3-5个地方政府或大型企业的标杆项目签约,形成新的收入增长点。
长期逻辑(1-3 年)
- AI大模型在垂直行业的商业化:公司拥有海量高质量文本语料和行业知识库。预计到2028年,AI相关业务(模型服务、应用开发)收入占比有望从目前的低位提升至30%以上,成为核心驱动力。
- 数据要素市场化核心受益:作为拥有数据采集、治理、分析全链条能力的厂商,公司卡位优势明显。预计随着国家数据局政策细则落地,到2027年数据要素相关服务收入年复合增长率(CAGR)有望达到50%。
- 安全业务的稳健基本盘:公司内容安全、数据安全产品具备护城河。预计未来3年该业务板块收入将保持年均8-10%的稳定增长,为公司转型提供现金流支撑。
产销链分析
主要客户(口径:年报)
公司客户集中度较低,服务对象分散。根据2025年年报,前五大客户合计销售额约为0.98亿元,占年度总营收的19.18%。其中,第一大客户为某中央级媒体集团,销售额约0.31亿元,占比6.07%。客户主要为政府、事业单位、大型媒体和金融机构,订单能见度通常以半年到一年的项目周期为主,一次性项目居多,存在一定的季节性波动。
主要供应商(口径:年报)
公司为软件企业,采购主要为硬件设备、云服务及外包人力。前五大供应商合计采购额约为0.42亿元,占采购总额的23.5%。关键物料为服务器、GPU算力及商用软件授权,不存在严格的单源依赖,但高端GPU供应受制于国际形势。公司备货策略较为灵活,通常根据项目进度按需采购,对关键硬件(如GPU)会进行一定安全库存储备。
关键财务指标
| 关键财务指标 | 2025-12-31 | 2026-03-31 |
|---|---|---|
| 营业总收入(亿元) | 5.11 | 0.65 |
| 归母净利润(亿元) | -2.94 | -0.77 |
| 扣非归母净利润(亿元) | -3.36 | -0.81 |
| 毛利率 (%) | 61.45 | 58.2 |
| 净利率 (%) | -57.69 | -118.4 |
| 净资产收益率ROE (%) | -7.38 | -1.9 |
| 经营活动现金流净额(亿元) | 0.23 | -0.85 |
| 总资产(亿元) | 43.2 | 41.5 |
| 资产负债率 (%) | 8.56 | 9.1 |
数据来源:2025年年报、2026年一季报。2026Q1毛利率、净利率为估算值。
财务健康解读 成长性与盈利能力:公司2025年营收基本持平但净利润大幅转亏,主要源于研发投入加大及部分项目延期。2026Q1营收同比下滑47.65%,显示短期业务开展仍不顺畅,盈利能力(毛利率)保持稳定但费用侵蚀严重,净利率深度为负。 现金流质量:2025年经营现金流净额为正(0.23亿元),表明主营业务的现金回款能力尚可,未因亏损而恶化。但2026Q1经营现金流转负,反映季度内业务活动产生的现金流出大于流入,与项目周期和收入确认节奏有关。 资产负债结构:公司资产负债率极低(8.56%),无有息负债,财务结构非常稳健。总资产以货币资金、应收账款和无形资产(软件著作权、数据资源)为主,资产质量较高,抗风险能力强。 费用端异常项:2025年及2026Q1,公司期间费用率,特别是研发费用率和销售费用率大幅攀升,是导致亏损的主因。这属于公司为推动AI战略转型进行的主动投入,短期内对利润造成压力,需观察后续投入产出效率。
注:表格列名必须明示口径(YYYY 年报 / YYYYQ?)。
海外对标对比
| 维度 | 本公司 | 对标A | 对标B | 节奏差 |
|---|---|---|---|---|
| 营收 YoY(最近季度) | ||||
| 毛利率(最近季度) | ||||
| 估值 PE | ||||
| 关键指引 |
对标公司具体数字依赖
_AP-Agent海外财报追踪.md周扫填充
行业分析
需求端驱动:核心驱动力来自两方面:一是政府与企业数字化、智能化转型进入深水区,对AI赋能、数据治理的需求刚性;二是国家“数据二十条”落地,推动数据要素市场化,催生数据资产化、入表、交易的新兴服务市场。 技术迭代路径与当前节点:行业正从传统NLP、大数据技术,快速迭代至以大语言模型(LLM)为核心的生成式AI阶段。当前处于“基础模型能力涌现”向“行业垂直模型应用落地”过渡的关键节点,拥有行业数据和场景know-how的企业具备后发优势。 供给瓶颈:高质量、多模态、合规的行业数据语料成为稀缺资源;同时,既懂AI技术又懂行业业务的复合型人才供给不足。此外,GPU算力成本高企也制约了中小企业的模型训练与应用探索。
同业对比
与同业公司如汉王科技(002362) 和科大国创(300520) 相比:
- 汉王科技:同样在NLP和AI领域布局,但更侧重于终端产品(如手写笔、扫描仪)和To C市场,业务模式较拓尔思更“重”。
- 科大国创:以电信、电力等行业软件和大数据解决方案为主,在数据中台建设上与拓尔思有交集,但行业聚焦不同。
- 拓尔思的差异化:在于其独特的 “内容理解+数据治理”双轮能力,在媒体、出版、政务舆情等文本数据密集型行业壁垒更深,且在数据要素化布局上更为前瞻。
逻辑链
AI capex → 环节 → 公司受益点 大模型迭代加速 → 算力/数据需求扩张 → 公司 AI大模型在垂直行业的商业化 形成竞争力
催化事件时间表
| 时间 | 事件 | 影响 |
|---|---|---|
| 2024-10 | 发布“拓天”媒体行业大模型 | 标志着公司AI大模型战略正式启动,提升了市场关注度。 |
| 2025-08 | 获得某省级政府大数据平台重大项目 | 金额约1.2亿元(据公告),验证了公司在政务大数据领域的龙头地位。 |
| 2025-12 | 2025年年报发布,业绩出现大幅亏损 | 引发市场对公司战略转型期盈利能力和前期投入产出的担忧,股价承压。 |
| 2026-06(预期) | 国家数据要素基础制度配套细则出台 | 作为数据服务龙头,政策落地将明确数据资产入表、交易等路径,直接利好公司业务。 |
| 2026-Q3(预期) | “天目”数据资产化平台实现首个标杆客户落地 | 证明公司从“软件商”向“数据服务商”商业模式的可行性,打开估值空间。 |
| 2027-Q1(预期) | 2026年年报发布,业绩有望实现扭亏为盈 | 若实现,将标志着公司战略转型初见成效,市场信心有望大幅修复。 |
自动跟踪(dataview 拉 04-催化事件)
风险与跟踪点
风险
- 下游需求风险:公司核心客户为政府、事业单位,其IT预算受财政状况和政策周期影响较大。若宏观经济增速放缓,可能导致客户数字化投入收缩,项目延期或取消,影响公司收入确认。
- 供应链风险:公司AI大模型训练和推理依赖高性能GPU。若因地缘政治等因素导致高端GPU供应受限或成本飙升,将直接影响公司研发进度、运营成本及产品竞争力。
- 技术迭代风险:AI技术迭代速度极快,存在技术路线变革的不确定性。若公司未能紧跟行业最前沿的技术路径(如多模态、智能体),可能导致前期大量研发投入的成果难以产品化或竞争力下降。
- 市场竞争/价格战风险:AI和大数据赛道涌入大量厂商,包括互联网巨头、垂直领域创业公司等。市场竞争加剧可能导致项目报价承压,毛利率下滑。同时,数据要素市场尚处早期,商业模式不清晰,存在跑马圈地式的价格竞争风险。
跟踪点(含频率)