摘要:说他们公司去年下半年花了小一百万接入ChatGPTAPI,还招了两个大模型算法工程师,连私有化部署的服务都买了。
前几天跟做企业数字化的朋友老周吃饭,他一开口就吐槽。
说他们公司去年下半年花了小一百万接入ChatGPTAPI,还招了两个大模型算法工程师,连私有化部署的服务都买了。
本以为很快就能靠AI提效率,结果快半年了,AI项目连个像样的成果都没拿出来。
席间还有个做制造业的朋友,也跟着点头。
他说他们厂想搞设备故障预测的AI项目,投入了两百多万,最后卡在数据上,生产数据散在ERP、MES等六个系统里,根本串不起来。
AI模型喂不进能用的数据,最后只能放在那落灰。
说实话,现在身边搞企业AI的,十有八九都遇到过这种情况:模型、人才、钱都到位了,偏偏栽在数据上。
咱们先说说那些大模型为啥能成。
你看OpenAI搞GPT-4的时候,手里有近1.4万亿tokens的公开数据。
这些数据是公开互联网攒了几十年的,格式都统一,不是网页就是文本、图片,来源也连得通。
就像提前洗好切好的菜,厨师拿过来就能下锅。
可轮到企业自己搞AI的时候,情况就完全反过来了。
老周跟我说,他们公司的数据散在CRM、ERP、客服系统等十几个地方。
有的存在老服务器里,有的还在员工的个人Excel里,甚至还有纸质文件没录入系统的。这些数据不光放得乱,格式也五花八门——客户地址有的写“京市朝阳”,有的写“北京市朝阳区”,日期有的是“2024.5.1”,有的是“2024-05-01”。
本来想建议老周他们先把数据归拢到一块,后来发现他们连数据在哪都没完全摸清。
更别说让AI用这些数据了,就像想做饭,结果菜在厨房各个角落,有的没洗,有的没切,再好的厨师也没法下手。
如此看来,企业AI的核心麻烦根本不是模型不够强,而是连给AI“喂饭”的合格数据都凑不齐。
企业想把数据用起来,得先闯过三关,这三关就像三只拦路虎,少一个都不行。
老周说,他们公司想分析高价值客户,销售部让AI查客户的消费记录,结果AI找了半天,发现客户数据一部分在CRM,一部分在客服的工单系统,还有一部分在市场部的活动登记表里。
找个数据得跨三个部门问人,光找数据就花了一周。
这种情况真不少见,很多企业没有统一的数据源,数据就像藏在百慕大三角,想找着全看运气。
就算运气好,把这些散着的数据找着了,新的麻烦又来了,“数据用不了”。
有个做金融的朋友跟我说,他们搞信贷风险评估AI项目,好不容易把客户数据凑齐,结果发现身份证号有的15位,有的18位,联系电话缺失了近四分之一。
他们组建了十个人的团队清洗数据,两个月才弄完六成,项目直接延期。
很显然,这种“脏数据”给AI用,最后出来的结果肯定不靠谱,这不就是“垃圾进,垃圾出”吗?
好不容易把前两关闯过了,第三只拦路虎又冒出来,“数据拿不到”。
我认识个做汽车供应链的,他们想搞供应链风险预警AI项目,需要采购部的供应商数据和生产部的物料数据。
AI模型训练时只能用部分数据,最后预警准确率才刚过五成,根本没法落地。
搞不清的是,很多企业把数据捂得太严,部门之间调个数据要走四五个审批流程,等批下来,机会早就过了。
破局,从“小场景”起步,让数据自己“转起来”。
既然数据有这么多麻烦,那企业就只能干等着吗?当然不是,有个办法能慢慢搞定,就是启动“数据飞轮”。
有个做SaaS的公司就很聪明,。他们没一开始就想建个完美的数据湖,而是从“客户流失预警”这个小场景切入
先只打通了CRM的客户行为数据和客服的工单数据,AI的预警准确率从六成升到了八成五,帮他们挽回了一成二的高价值客户。
后来用这个成果申请了预算,再去打通财务的回款数据,把预警维度从“行为+服务”扩展到“行为+服务+财务”,准确率又升了一成。
这种小步快跑的方式,比一上来就砸钱建数据湖靠谱多了,毕竟先看到价值,才能有动力接着做。
光有飞轮还不够,还得搭好“智能地基”,从根上解决数据问题。
比如搞数据治理,有个车企去年制定了数据规范,把数据分成客户、生产、研发三大类,统一了字段格式,还明确了每个数据的责任人。
这么一来,数据清洗效率提了四成,脏数据率从两成八降到了九成。
还有数据中台,就像个数据“中转站”,把各个系统的数据归拢过来,再封装成能用的接口
有个零售企业搭了中台后,AI项目调数据的时间从七天缩到了两小时,效率一下子就上来了。
另外,企业还得搞清楚数据准备的三个层次,首先得让数据能被访问,比如存在统一的数据湖里,能通过API调出来,其次得让AI能理解数据,比如给数据贴标签,说明每个字段是啥意思,最后得让数据能反复用,比如每次业务做完,自动把新数据加进去,形成闭环。
有个银行按这三层做了之后,AI模型的迭代周期从三个月缩到了一个月,效果很明显。
现在大家都在抢大模型,可说实话,等过两年,顶尖模型就像水电一样,谁都能用上。
到时候企业拼的,肯定是自己的数据——谁家的数据干净、能互通、能持续产生价值,谁就能在AI时代占到优势。
本来觉得企业搞AI,只要有钱有技术就行,后来发现根本不是这么回事。
数据才是最基础的东西,要是现在不把数据的麻烦搞定,就算买再好的模型,招再牛的工程师,也只能是白忙活,企业要是想在AI上不落后,怕是得从现在开始,好好琢磨自家的数据了。
来源:奇史怪谈