数据要素 × AI:开启行业创新密码

B站影视 2025-01-20 22:32 3

摘要:12月26日,备受瞩目的“释放×数效应·共创智+未来”2024第七届金猿&魔方论坛——大数据产业发展论坛暨数据要素趋势论坛在上海明捷万丽酒店成功举行。本次论坛由金猿组委会、数据猿、上海市数商协会及上海大数据联盟联合主办,新华社中国经济信息社作为支持单位,汇聚了

12月26日,备受瞩目的“释放×数效应·共创智+未来”2024第七届金猿&魔方论坛——大数据产业发展论坛暨数据要素趋势论坛在上海明捷万丽酒店成功举行。本次论坛由金猿组委会、数据猿、上海市数商协会及上海大数据联盟联合主办,新华社中国经济信息社作为支持单位,汇聚了来自政府、企业、学术界及媒体界的数百位精英人士,共同探讨大数据及数据要素产业的未来发展。

会上,来自各行各业的嘉宾大咖围绕“大数据”、“人工智能”等行业技术热点展开讨论和交流。在过去的一年中,人工智能依然是非常热门的话题,而且它对于各行各业行业的影响和渗透已经越来越深入,尤其是生物医药、医疗、教育、制造等领域,大家在纷纷拥抱新技术带来的机会,同时应对潜在的挑战。然而,到目前为止,人工智能、大数据究竟在这些领域发展到了什么水平?这些行业的参与者都在如何应用大模型?他们面临的挑战又是什么?

带着这些问题和好奇,数据猿高级主笔欧小刚与五位行业嘉宾展开对话和讨论。他们分别是:复旦大学附属中山医院计算机网络中心副主任张俊钦;金赛药业CIO、数字研究院院长鲜翾;读书郎智慧教育总经理荆全齐;上海电气中央研究院数字化能源资深系统架构师周明春及金智维科技副总裁、行业研究院院长姜志刚。

“无中生有”的能力

在生物医药领域,AI的应用一直备受关注,2024年诺贝尔化学奖授予了戴维・贝克(David Baker)、德米斯・哈萨比斯(Demis Hassabis)和约翰・江珀(John M. Jumper),表彰他们在计算蛋白质设计和蛋白质结构预测方面的贡献。AlphaFold等AI工具的应用,将原本需要耗费数年时间的蛋白质结构预测过程缩短至仅需几分钟,极大地加速了新药研发进程,提高了研发效率及成功率。因此,行业外的人都在关注,究竟AI在生物医药领域的被使用到什么程度?还会遇到什么问题?如果想要实现AI大模型的规模化应用,在数据层面还需要解决哪些问题?

金赛药业是一家从事医药生产、研发、销售的公司,主营业务集中在儿童长高、成人抗衰和女性辅助生殖领域。鲜翾认为,大模型在生物医药领域的应用呈现出显著的创新性,其核心能力可以概括为“无中生有”。以往研究人员对蛋白质结构进行建模往往需要耗费大量时间,一个博士研究生可能在四到五年的博士生涯中仅能解决一个蛋白质结构问题。而现在,大模型能够在短时间内预测出多个蛋白质结构,大幅提升了研发效率。这种从无到有的能力不仅推动了科学研究的进步,还使得研究人员能够进一步优化蛋白质分子设计。例如,对于某些靶点,由于结合位点有限,通过大模型的辅助,研究人员可以设计出更小的蛋白分子,既降低了生产成本,又提高了蛋白与靶点的结合效率,从而提升了产品性能。

目前,大模型的应用已成为金赛药业业务发展的推动力之一。公司内部搭建了专门针对化学药物、双抗、单抗及其他研发方向的数据集,并结合独特的蛋白质结构算法,不断优化研发流程。通过对市面上表现优异的模型进行评估和借鉴,公司能够更精准地确定研发靶点并优化分子设计。这一过程不仅提升了效率,还为研发策略提供了数据支持。

除了蛋白质结构之外,多模态模型对于菌株培养工艺水平的提升也非常显著。传统的菌株培养依赖点状数据采集,难以全面掌握生长过程中的动态变化。而通过引入动态数据采集设备和多模态模型,公司能够实现对菌株生长过程的实时监测,例如表达量和纯化效率等关键参数。这种连续动态的数据采集方式,不仅让培养基成分的筛选更加精准,还有效提高了生产质量和产量。相比传统方法,这种基于大模型的技术手段为企业节省了大量成本,并显著提升了工艺水平。

鲜翾提到,多模态数据的融合是未来发展的关键。生物医药领域涉及的数据种类繁多,包括医疗影像、质谱检测数据、分子层面数据以及点状数据等。这些数据需要经过特定的训练,与大模型深度结合,才能充分发挥其价值。金赛药业通过内部数据集的建立,结合开源模型在不同的应用场景中选择表现最佳的模型进行微调,确保模型在特定业务场景中的表现达到最佳。

当然,尽管大模型非常好用,但鲜翾认为在使用大模型之前,需要先明确的定义问题,从而确保资源投入的有效性和模型应用的生产价值。毕竟,大模型的使用成本,包括算力消耗和电力支出,仍是一个不容忽视的问题。未来,企业需要进一步优化数据采集与使用流程,以更低的成本实现更高的商业价值。

“从有到优”的提效

张俊钦认为,医疗领域的大模型可以定位为“从有到优”。这与生物医药领域的“无中生有”形成对比。因为医疗场景通常较为固定,颠覆性创新较少,更多是通过技术的融合实现提质增效。核心目标在于,在现有的医疗场景中,最大化释放有限的人力、物力和财力资源,从而为患者提供更优质的服务。他列举了两个常见的场景。

首先是智能客服。医疗机构每天都会面临大量患者咨询,传统模式下多依赖话务台或呼叫中心,其服务能力完全受制于人力资源的投入。然而,人力资源存在两个显著限制:一是人员的工作时长有上限;二是人员的知识储备参差不齐,这就导致人工客服的回答质量不稳定。为解决这些问题,医院引入了AI大模型,在初期阶段,大模型的训练基于传统模式下积累的问答知识和沉淀的关键要点,同时与人工客服同步运行,进行自我学习和完善。刚上线时AI的问答准确率仅为60%,但经过六个月的持续优化,准确率提升至96%,且大幅度精简了专职客服团队人数,显著降低了人力成本,充分展现了大模型在优化既有场景中的提质增效能力。

第二是体检报告的智能化生成与解读。传统体检报告通常仅包含检查结果的数值,患者需要自行解读或向医生咨询,了解异常指标的意义及可能的健康风险。这种模式不仅增加了患者的困惑,也占用了医生大量的时间。为改善这一问题,医院研发上线了智能化体检报告系统。通过大模型技术,系统能够将检查结果与医学知识结合,生成既包含数据,又附有详细分析的报告。例如,对于某项指标异常的情况,系统会结合患者的性别、年龄等因素提供个性化健康建议,甚至提示是否需要进一步检查。这种创新不仅显著提升了患者的体验,也有效减轻了医护人员的文书工作压力,使他们能够将更多时间用于直接的医疗服务。

当然除了大模型在带来提质增效的同时,也存在着不少问题和挑战,尤其是成本问题和数据安全问题。张俊钦提到,大模型底座在医疗领域中的建设成本开销,除了传统的算力建设成本之外,还有高昂的能耗成本。医疗机构通常需要自建机房来支撑基础设施本地化部署,其能耗开支成为不可忽视的成本支出。为此,行业内普遍倡导建设绿色机房,通过光伏发电、热能回收等方式实现能源来源的多元化,同时在制冷系统中采用更节能的氟泵空调或尝试性引入水冷技术,以降低整体能耗。

在数据安全方面,传统的安全技术及防护体系无法完全适配大模型场景。例如,医疗行业已发生过大模型数据泄露事件,导致敏感数据和模型成果外流,且整个安全事件发生过程中,传统安全防护体系未能发挥很好的监测预警作用。这不仅威胁到数据安全,也可能打击模型研发投入的积极性。为此,医疗机构需要与时俱进,探索并构建匹配大模型场景的安全防护监测体系,并在模型开发和使用过程中严格防范潜在的安全隐患。

医疗领域的大模型应用并非完全的颠覆性创新,现阶段更多是通过优化既有场景实现效率提升和服务质量的改善。从智能客服到体检报告的智能化生成解读,再到绿色机房建设和安全防护体系探索,每一个实践都展现了AI技术在医疗行业中的广阔前景。然而,这一切的实现离不开持续的技术探索和行业赋能,只有这样,才能在成本与效益之间找到平衡,为患者提供更优质的医疗服务。

AI+教育:这么近,那么美

荆全齐是教育行业的“老兵”,读书郎是从教育电子出发,从一开始的教育电子到后来做相关的教育内容,包括教培,这是之前的业务,到现在全面转化为教育数字化的业务,而提供的产品服务形态从一开始的教育电子硬件、平板电脑等,到后来的提供课程、内容的服务,直到今天是依靠大数据和大模型提供个性化的新型的教育服务。从公司的发展经历也能看出,教育行业的转变速度非常迅速,对于科技的敏感度非常高。

他认为,教育行业是当前最贴近“AI+大数据”应用的领域之一。教育行业具有一定的独特性:覆盖范围广、涉及人群多样、年龄跨度大、场景复杂多样等。也正因如此,教育行业中许多问题能够通过“大数据+大模型”的新型生产力得到有效解决。他提到了三个常见的场景,从学生和教师的角度介绍了AI大模型和大数据带来的“减负提效”的效果。

首先是学生的心理测评。传统方法通常采用固定量表,由学生填写后回收。这种方式存在几个显著缺点:量表的统计维度单一、数据准确性难以保障(学生可能随意填写),以及数据采集完成后缺乏后续指导。而在大模型的应用场景下,心理测评已经实现了多模态交互。例如,基于大模型的心理测评系统通过拟人化的交流,与学生进行类似视频通话的互动。一方面,该系统能够与学生建立共情,另一方面还能全面覆盖量表中的问题,并深入引导学生挖掘潜在问题。通过这种方式,不仅可以获取更真实、准确的心理健康数据,还能生成针对个人的后续干预和指导方案。这种依托于心理健康大数据和大模型的创新应用,已经在部分学校得到了实践,成为心理健康场景中的典型案例。

另外,在线上教学场景中,传统的线上教学模式主要依赖于视频资源进行一对多的广播式教学,难以满足学生个性化学习需求。而现在,通过大模型和数字人技术,教学模式得到了显著提升。例如,“数字人教师”能够根据学生的学习情况,提供个性化的学习指导。在学生解题过程中,大模型可以对每一个错误步骤进行归因分析,并引导学生优化思维方式,从而实现精准辅导,大幅提高学习效率。

对于教师而言,大模型的应用同样具有变革意义。以批改作业为例,传统模式下教师需要花费大量时间进行机械化的批改工作,这不仅占用了宝贵的教研时间,还可能因疲劳而降低准确性。而通过大模型技术,作业批改的准确率已可达到99%以上。教师从机械化的工作中解放出来,可以将精力集中于学情分析和教学研究,从而推动教育质量的进一步提升。这种从重复性劳动中释放生产力的过程,正是大模型赋能教育行业的一个典型场景。

通过上述的三个场景可以发现,“AI+大数据”对于教育行业的改变,不仅仅让学生成为受益者,教师、学校也是新技术的受益者。对于教育行业的应用服务提供商来说,大模型的引入为原有的服务和内容带来了全面革新。荆全齐自信的谈到,“在AI的时代,教育行业可能所有的应用都值得用大模型重做一遍。”

经验胜过知识

尽管“AI+大数据”在教育行业正在热火朝天的改变教学方式和思路,但是在工业领域却“小荷才露尖尖角”。周明春这十多年一直在关注传统能源领域中的数字化变革,从过去的能源消费侧改革-智慧楼宇到现在的产用一体化综合能源数字化管控。在他看来,工业领域相较于电商和教育行业,大模型的实际应用尚未显得十分明显。目前,大模型最常见的应用场景包括智能问答和文本生成。在能源领域,尤其是医院的数据中心,对大模型的需求尤为强烈。由于大模型在运行过程中需要大量的GPU算力,导致能源消耗显著增加,因此对于GPU高效机房的能源管理需求也相应增强,这为商业领域提供了巨大的机遇。

为何工业领域中AI的渗透会比较慢呢?他认为,许多行业过去依赖顾问式服务,一些常识性问题实际上可以通过大模型来解决。然而在行业大模型中,更多的是依赖于经验积累。以自动化控制为例,尽管每年有大量自动化控制专业的毕业生,但在实际项目中能够熟练调试PLC和DDC的人才却极为稀缺。这并非因为缺乏理论知识,而是因为在实际工作中需要通过实践来摸索和积累经验。大模型的优势在于其庞大的参数量,相较于传统的规则引擎或模型驱动的控制方式,大模型能够考虑更多的因素,如能源管理中的天气因素和电价差异等。然而,还有很多外部因素尚未被完全纳入模型中,因此大模型的实际落地应用会慢一点。

当然,在工业领域中,机理模型与数据模型的融合是一个重要趋势。机理模型类似于大模型中的预训练模型,它将过去的经验总结并用数学方式描述物理世界。这种模型在大多数情况下是适用的,但如果外部环境发生变化,就需要大数据的输入来实时校正模型,使其更加实用。因此,目前工业领域所做的机理模型与数据模型的结合,实际上是将专家经验用数学方式表达,并结合实时信息和用户反馈来优化模型参数。未来大模型可能会在这个方面有更大的发挥价值。

此外,周明春还注意到,近年来,具身机器人因其能够感知外部环境而变得特别受欢迎,这使得它们能够更好地适应生产线上的需求,这可能也会增强人工智能对工业领域的变革,毕竟,当前很多制造车间的机器人或机械臂,通常都是按照固定流程执行任务,在按需生产这种产线场景下的适应性不高。

让数据流动产生价值

上述四位嘉宾从各自所在的行业和企业业务出发,讨论了AI和大数据在行业和企业中的应用,可以发现,AI给每个行业的变化节奏并不一致,而且这种节奏的不同并不完全是AI技术的原因,还与行业特性有关。最近一段时间,智能体(AI Agent)的概念非常火热,很多传统的人工智能公司和机器人流程自动化(RPA)公司也在纷纷往这个方向探索,RPA与大模型的结合,又如何为企业进行赋能呢?

姜志刚所在的金智维科技,一直在机器人流程自动化(RPA)与大型模型、AI等技术的融合方面开展深入探索和研究。目前,金智维科技已为超过1200家金融机构、政企单位提供服务,向市场推出了超过100万个RPA智能体。

他表示,过去的智能体主要基于固定策略执行规则化活动。然而,随着大模型技术的出现和引入,整个行业迎来了创新的商业模式和形态。他认为,将AI Agent(也称为数字员工)用于辅助人类员工决策和执行工作流程,必须要让数据要素发挥价值,确保数据的可供应性、流动性和有效性。在整个闭环中,AI技术对数据流动和数据价值的体现至关重要。

当前,数据的年新增量巨大,如何有效利用这些数据,是许多企业正在探索的问题。过去许多大型企业将数据集中起来,成立数科公司,建立数据中台,集中使用数据。但最终的效果并不理想。金智维科技现在尝试将大型企业二三级公司系统中的数据实现“所见即所得”,即人类员工能接触到的数据都可以通过AI Agent数字员工直接采集、分类、加工和应用,从而大幅降低数据应用成本,确保数据的有效供应和流动。例如金智维K-DVS数字可视化解决方案,通过聚合企业各类业务数据、运营数据,以可视化的形式,帮助管理层直观地观察、分析和理解数据,降低数据获取和使用的成本,让数据在更广泛的范围内被应用。关于数据的有效使用,姜志刚认为,必须让数据服务于业务场景,只有丰富的场景应用,为客户带来真正的价值,整个商业闭环才能成立。因此,无论是大数据还是人工智能,包括为产业场景赋能,只有形成良性闭环,数据要素的价值才能得到体现和应用。

目前,金智维数字员工已经在上万个业务场景中实现了应用,持续助力各行各业深挖数据的潜藏价值。近几年,金智维科技为国内两家最大的银行提供了企业级的数字员工平台,根据他们的统计,过去一年中,银行利用RPA、AI等技术赋能,充分发挥数字员工能力,帮助银行智能增效最高达3万人/年,这确实为客户带来了极大的赋能。按照人员成本计算,每家银行一年可以节省超过2000人年的运营成本,这是为客户带来的实实在在的价值。

展望未来,AI和大数据会在各个行业继续“大显神通”。不同行业会相互学习借鉴,不断拓展技术能施展的空间,把数据的价值挖得更深。在保障数据安全的同时,让产业之间的合作更紧密、更智能。新的应用和商业模式会像雨后春笋般冒出来,引导着行业和企业朝着智能化、数字化大步迈进。

来源:数据猿

相关推荐