数据分析师,即将从工业领域“消失”?

B站影视 内地电影 2025-08-15 14:33 1

摘要:2023 年底,一则 Google 裁撤数据科学家的新闻引起业内关注。有媒体猜测,Google 计划用 AI 自动化取代部分人力,导致数据科学家岗位减少。而在最近两年,随着 AI+BI 的产品形态逐渐普及,这种岗位裁撤风潮大有蔓延趋势,从新零售到金融,最终传递

作者 | 王一鹏

2023 年底,一则 Google 裁撤数据科学家的新闻引起业内关注。有媒体猜测,Google 计划用 AI 自动化取代部分人力,导致数据科学家岗位减少。而在最近两年,随着 AI+BI 的产品形态逐渐普及,这种岗位裁撤风潮大有蔓延趋势,从新零售到金融,最终传递到工业领域。

尤其是在工业领域,行业壁垒较高,数据分析师本就是稀缺物种。如今,这一岗位的编制或面临进一步缩减。

AI 冲击数据分析师岗位的第一步,是将取数、做报表、给出分析结论等一系列工作,通过自然语言自助化完成,将任务交付时间压缩至分钟级。

到了 2025 年,AI 的职能边界进一步扩张。甚至不需要老板下命令,就能根据企业所在的领域、所积累的数据,将合适的数据以恰当的方式,主动推送给对应的负责人。

可以说,数据的消费范式,已经变了。

本质上,老板需要的不是数据,而是业务洞察,且洞察方向随着业务的开展,会不断出现变化。但岗位职能不同,接收到的上下文也不同,员工绞尽脑汁,耗时数天至数周给出的报表,通常也很难令老板满意。从前,企业被迫接受这一事实,苦恼的是业务一号位以及 HR;现在,AI 正在重新制定“游戏玩法”。

数据找人、无问智推?数据分析师会在多大程度上被 AI 取代?InfoQ 特别采访了涛思数据创始人 &CEO 陶建辉,聊了聊涛思数据最新的发布,以及 BI 类产品正在发生的变化。

1 人找数据,从未简单过

2025 年 7 月 29 日晚,TDengine 发布了一款全新产品 —— TDengine IDMP(Industrial Data Management Platform,工业数据管理平台),以“用 AI 改变数据消费范式”为主题,主打让数据自己说话,不用提问或拉取数据,而是将实时业务洞察所需要的可视化面板、实时分析任务主动推送给你。

在笔者眼中,陶建辉老师始终是一位情绪非常饱满的持续创业者。自 2008 年开启移动互联网领域 IP Push 与 IP 实时消息服务的创业之路起,到后来深耕时序数据库 TDengine,他一路走来始终保持着充沛激情。而当发布 TDengine IDMP 产品时,他的兴奋之情尤为强烈 —— 尤其是对其核心功能 “无问智推”,更是寄予厚望,坚定认为这是在 AI 时代下,足以带来 “范式革命” 的关键产品。

要回溯这种兴奋的源头,我们必须要明白 BI 类产品在数据的供给和消费问题上,长期以来所面临的问题。

我们可以将 BI 产品的发展,简单概括为三个阶段:

报表式 BI 最早于上个世纪就出现了,是最原始的形态:IT 人员先建模、后出表,通过邮件进行分发,业务人员仅负责提出需求和查看结果。这种 BI 本质上只是在解决“没有数据可看”的问题,是信息化的早期产物。

除了功能受限,报表式 BI 的另一大问题在于,技术人员完全不理解业务,建模速度也跟不上业务发展。于是自助式敏捷 BI 出现了,主打一个“还政于民”,建模的主体变成了业务人员,建模的方式是拖拉拽,同时通过实时连接数据仓库或大数据引擎,解决“数据时效性差”的问题。

不过,“还政于民”,初衷是好的,结果却不尽如人意。太多的人有权限进行数据建模,导致“数据沼泽”出现了,企业经营数据甚至做不到口径上的统一——同样叫做“毛利率”,但在销售部门和运营部门是完全不同的算法。

于是大约 2019 年之后,指标化 BI 产品开始出现。指标化 BI 是在数据仓库 / 数据湖与 BI 工具之间构建一个“统一指标语义层”,意思就是要对基础的指标和计算口径进行共识,比如:销售额 = 含税成交总额 - 退货额,这一公式只允许存储一次。数据维度、修改历史都做好限制和记录。

指标化 BI ,等于在一定的限制下,“还政于民”。那么,指标化 BI 解决得了产业的问题吗?Gartner 等研究机构并未针对指标化 BI 产品做单独的落地成功率统计,但 2021-2023 年对“整体 BI/ 数据分析项目”的统计区间显示,超过 60% 的 BI 项目未能达到预期效果。

抛开纷繁复杂的大数据技术名词,BI 类产品进化与拉扯,始终是在解决“人”的问题。

人无法做数据化决策,所以出现了报表式 BI ;技术人不懂业务,所以出现了自助式敏捷 BI ;业务人自说自话,所以出现了指标化 BI 。而在任何一家公司内,具备深度业务认知,且能紧跟业务发展,用数据建模的思维组织材料,敏捷生产洞察报告的人才,都是极少的。所以即便我们发明了“数据分析师”这个岗位,也依然不能将 BI 落地的成功率提高。

当这一问题出现在新零售领域时,其严峻程度或多或少是被冲淡了。毕竟,像库存周转率、订单满足率这类数据指标,即便不明确计算公式,多少也能理解其反映的业务情况。但在工业领域,许多数据指标是与工艺联系在一起的,理解成本骤然上升。

比如在烟草行业,需要关注的指标有:回潮温度、打叶效率、叶丝填充值、蒸汽单耗等,不但要理解其含义、计算方式,还要意识到,这些指标在数值上,是有参考标准和取值范围的。

每一年随着工艺和法律法规的变化,相关指标的参考标准都有可能发生变化。比如 AI 视觉检测技术成熟后,烟草行业的残次频率已经从 0.8% 降到了 0.12%。不要以为这一数据变化只有汇报价值,据烟草行业测算,一家中型烟厂每年可因此节省原料成本超过 222 万美元。

一个普通业务人员,很难做到对这些工艺指标、取值范围、每年变化了如指掌,甚至即时调整数据建模,产出对应的报告。

这是数智化转型的核心困局:人的能力即是瓶颈,软件只能辅助,不能根除。

直到 2022 年, AI 打破了这一逻辑,AI 的知识量与工作效率,对于人而言是“降维打击”。到了 2025 年,AI Agent 端到端任务平均通过率已经突破 70%,对 Level-1 级难度的任务通过率已经突破 85%。

从前在企业内缺位的数据专家,今天可以由 AI Agent 出任,这是 TDengine IDMP 所做的事情,也是陶建辉老师为何如此兴奋。

2 数据找人,涛思数据的解决思路

那么,所谓的由 AI Agent 出任数据专家,实现“数据找人”,是对 ChatBot 进行简单套壳吗?是单纯地集成一个 DeepSeek 吗?

当然不是,在发布日,涛思数据公布的 IDMP 架构如下:

大数据平台,尤其是工业领域的大数据平台,不光是解决数据分析问题,也是在解决数据的采集和治理问题。涛思数据的前置技术积累是充分的,在时序数据库上,有性能强大且具备开源口碑的 TSDB 做支撑。

TDengine TSDB 单个集群可以支撑起 10 亿级测点,配合高效的存储引擎,整体成本是通用平台的十分之一。它具备良好的系统开放性,支持 JDBC、ODBC、REST API 等接口,能够与 MES、ERP、AI 等企业系统无缝集成;支持数据订阅,数据不仅能流进来,还能实时流出去,不被厂商绑定;部署方式也更灵活,兼容 Windows、Linux、虚拟机、容器等多种环境,适配各种工业现场需求。

TDengine TSDB 是一个基础,保证 TDengine IDMP 可以高效获得业务数据。接下来, TDengine IDMP 基于采集到的实时数据,创建数据目录,做好数据标准化、数据情景化。

数据目录其实是数据孪生会涉及的概念,解决“数据在哪、属于谁、长什么样”的问题,AI/BI 工具可直接按目录路径调用数据,无需再写复杂 SQL。

数据标准化的目标是为了让跨系统数据可比、可用、可信,价值接近我们前面提到的“统一指标语义层”。

数据情景化,是为了让任何一条时序数据都能回答“它代表什么、在什么场景下、跟谁有关”,解决前面提到的“取值范围”问题。

接下来,TDengine IDMP 会通过内置的 Agentic AI,配合业务知识库,感知具体应用场景,自动生成指标、报表和分析任务,并主动推送业务洞察。其他核心能力还包括:

智能可视化:“无问智推”能够驱动 AI 根据当前业务场景自动生成可视化看板,告别手动配置

实时分析:支持多模态触发的流式计算,毫秒级反馈分析结果

事件管理:将分析结果转化为可执行事件,提供全链路根因分析能力

此外,IDMP 也率先将 Git 思维引入到数据建模与治理中,支持多人协同建模、版本追溯,使工业数据管理像管理代码一样高效、可控。

实际上,TDengine IDMP 的野心很大,它并非想单纯给工业大数据平台加一个 ChatBI,而是希望提升从数据采集到业务决策的整个链路的效率。涛思团队技术人员,在官方博客上,也对这种针对性设计做了解读:

“在不同的工业场景里,有八个痛点彼此关联、相互放大:

数据在采集环节就因为厂商和协议不同而被割裂;

进入系统后,又因缺少语义和上下文而“失去身份”;

质量问题无法在入口阶段解决,导致后续分析精度下降;

出于安全考虑,数据流动受限,价值被锁住;

海量数据积压在库里,缺乏实时处理能力;

新算法、新模型难以及时落地;

业务人员缺乏直接获取洞察的途径,实时决策受阻;

行业知识门槛高,新人难以快速胜任。”

“IDMP 的目标,是让数据从进入平台的第一刻起就‘有名有姓’,并沿着同一条语义化管道,稳定流向实时分析、事件管理和业务决策。”

陶建辉老师本人对 TDengine IDMP 的期待甚至还要更宏大:数据的消费范式正因此出现变革。

另有接近涛思数据的人士透露,目前团队围绕 TDengine IDMP 和智能制造领域企业的合作,如烟草、光伏、电力,已经在洽谈和推进中,来自客户侧的反馈和需求可能会进一步加快 TDengine IDMP 的迭代速度。

3 数据消费范式转变:工业领域或将开始下一次进化

从 TDengine IDMP 发布,到“数据找人”逐步成为业界的新风潮,智能制造正在逐步迈入新阶段。过去,人们对制造业存在某种“偏见”,认为其:薄利、固化、封闭、缺少标准,因而转型困难。

但随着如 TDengine IDMP 般的产品进入,制造业携移动互联网时代积累的通信、大数据技术,跑步进入智能化时代。整个产业因此变得更加灵动,变得更具生命力。产业进化的信号,即是发生在 2025 年的数据消费范式转移:从“人定义问题→找数据→等洞察”到“AI 定义场景→推数据→给行动”,传统数据分析师的职能被三个不可逆的结构性变化彻底消解:

技术替代:像 IDMP 般的工业大数据平台,将“业务认知 + 数据建模 + 实时推送”封装成基础设施,使 90% 的常规分析需求无需人工干预。

成本重构:当 AI 能以工程师 1% 的成本完成设备预测性维护分析(国家电网案例),“招一个分析师”从投资变成冗余。

权力转移:数据消费权从集中化的分析团队下沉至一线操作员——AI 用自然语言告诉工人“第 3 号锅炉需降负荷”,而非等待分析师的周报。

最终形态或许是,工业领域将出现真正的“数据零接触”组织——数据分析师的岗位描述从“提取洞察”变为“训练 AI 的业务规则”,而其编制规模随自动化率提升呈指数级萎缩。

至少,未来业务人员使用大数据平台,既不需要集中培训,也不需要排队等待 IT 人员定制 SQL。

AI Agent,会自己找上门来,融入工业体系的每一个流程。

今日好文推荐

来源:InfoQ

相关推荐