神州数码郭为:走出中国特色的AI之路

B站影视 2025-01-23 03:05 2

摘要:首先,我想让大家看一下这张图,这张图来自上海浦江实验室主任、首席科学家周伯文的一个报告。按照周教授的观点,结合人工智能专业性和泛化性两个维度分析,我们可以看到:

1月15日,神州数码董事长郭为在DC·AI生态创新中心开幕活动上发表主旨演讲,以下为演讲全文整理。

在刚刚落幕的2025年CES大会上,黄仁勋先生的演讲再次点燃了人们对人工智能的热情。在此,我也与诸位分享一下我们对中国人工智能发展路径的见解。

通专融合

首先,我想让大家看一下这张图,这张图来自上海浦江实验室主任、首席科学家周伯文的一个报告。按照周教授的观点,结合人工智能专业性和泛化性两个维度分析,我们可以看到:

图中的纵轴代表的是专业性。以DeepMind的AlphaFold为例,这一AI模型在生物分子相互作用结构的精准预测方面,已经助力两位科学家获得了诺贝尔奖。在蛋白质结构预测领域,它已经超越了人类的能力。我们常常讨论AGI如何超越人类,而AlphaFold已经给出了答案。但这样一个强大的AI,却可能无法回答一个简单的日常问题,这一现象反映了专业模型尽管在某一特定领域表现优秀,但其泛化能力极为有限。

横轴代表泛化性,按照周伯文教授的定义可分成狭义人工智能、广义人工智能和通用人工智能。例如Google、OpenAI和Meta等各自推出的大语言模型,都展示了在知识学习和压缩方面的卓越能力,表现出前所未有的灵活性和适配性,能够处理广泛的任务,并快速适应新情境。相比专业模型,这些大模型的泛化能力可以给人留下深刻的印象。但是,在高度专业化的问题上,它们的表现往往缺乏深度的专业理解和精准性。

因此,周教授指出,AI发展存在一个高价值区域,就是这张图右上角我用红圈标示出来的区域。也就是说,在专业性上,AI能力应达到或超过90%以上专业人士的水平。在泛化性上,AI需要达到广义人工智能级别的泛化能力,可以以极低成本实现不同任务之间的迁移。

这一“高价值区域”正是AGI路线图中的关键所在,也是未来推动新一轮技术革命的方向。只有在这个区域内,AI才能真正实现专业性和泛化能力的平衡,成为变革生产力和创新的核心驱动力。

如何让大语言模型在保持泛化能力的同时,还能精准解决专业问题,正是当前AI所面临的最大挑战。这不仅仅是技术问题,更是整个AI研究领域的战略目标。有人说AGI到来的时间是三年、五年甚至十年。从我的角度看,今天最重要的还是应用。对企业来说,关键在于如何实现商业化应用。它可能尚未达到完全的AGI水平,或许仅处于专业能力排名前1%甚至前10%的阶段。但我们真正需要研究的是,如何借助通用大模型,在较低成本的情况下实现这一目标。

但企业面临的问题更加复杂,不是一个蛋白质结构的问题,可能是多个类似于蛋白质结构的复杂问题交织在一起的问题。因此我们需要找到一个方法,让大语言模型能够在企业内部,保证大模型具备的强通用性、强泛化能力的同时,还能深度的适配特定的行业、企业的专业化需要,我们把它叫做“通专融合”。

泛化和专业化能力的融合:神州问学解决之道

针对这个“通专融合”高价值区的问题,神州数码给出了自己的答案——神州问学:神州问学是一个完整的平台,帮助企业从算力、模型、企业知识到智能体等多方面完成AI落地。

首先要解决企业如何在安全、可控的条件下,构建对自己业务问题的专业模型。本质上来讲,神州问学通过企业专属数据和生成数据,来驱动通用模型快速专业化,满足业务需求。运用强化学习和持续学习机制,让模型随着企业业务的变化不断进化。同时在企业内部混合部署通用模型和多个专业模型来解决通专融合的问题。

当然对一个企业来讲,还普遍存在诸如如何面对庞大的、散落各个地方的、各式各样的非结构化的数据,如何把这些数据变成企业的知识和大模型可以利用的数据集,如何保证企业知识和敏感数据的安全,以及知识的持续治理、有效数据不足等问题。这些都要求企业有一个知识管理和治理平台。而神州问学也在这些方面给出了一些答案。

神州问学可以提供知识管理的模块支持企业做数据准备,将内部的专有数据形成标准化的训练数据集;结合领域专家的知识对关键数据点进行深度标注,以增强模型的专业理解能力;同时帮助企业进行数据生成,利用数据合成技术生成高质量的合成数据,以补充真实数据的不足。在一些专业领域,如医疗行业,生成逻辑链路可以让模型可以更好的理解和推理复杂的场景,从而进一步推动模型的专业化。

另外,企业也需要一个平台来对大模型进专业化训练,需要管理和跟踪多个模型,让它们协同工作、有效反馈,具备持续优化模型的性能。神州数码也提供了模型训练和模型管理的功能。

同时我们也看到,由于企业要降低成本,不可能把所有的数据都用通用的大模型来训练,因此这方面我们也通过资源池化和虚拟化的方式,针对不同模型需求进行资源分配,降低企业应用大模型的成本。

我们通过“批量推理”的方式,提升了运行效率,更充分地利用了计算资源;同时采用混合精度计算方式,在推理阶段对模型权重进行优化处理;并通过并行计算等技术,持续帮助企业以较低成本将通用大模型改造为专业化模型。此外,为了提高传播效率,我们将产品发布在开源社区上。

“流水线”的启示——AI for Process

大家都知道,AI在科学研究领域(AI for Science)取得了很大的成就,发挥巨大的作用。但我们也必须看到,应用于科学研究的AI是不计成本的。而企业不一样,对于企业而言,开发专用模型并非易事,毕竟并非人人都能像训练AlphaFold那样轻松实现。通常只有少数国家的大型实验室才有能力完成如此大规模的投入。对于大多数行业、企业,甚至整个城市来说,这样的投入都显得过于沉重。因此,如何让更多的企业拥抱AI的成果,是我们目前面临的重要课题。神州问学希望为此提供一条可行的路径。

怎样才能提供这样的路径?左边这张图是我过去一年的研究成果。五、六年前,我提出了认知颠覆、技术颠覆和产品颠覆的概念,但如何真正实现这些颠覆?经过深入研究,我发现推动企业持续成长的关键在于三个要素:一是商业模式,二是管理方法,三是技术架构。这三者的有机结合能够不断推动企业的发展,而它们的结合点正是流程。

一百多年前,福特发明了流水线。其实,在流水线发明之前,电动汽车已经出现,而当时占据主导地位的是蒸汽机车,汽油发动机汽车仅占市场的20%。福特流水线的发明,使汽油发动机汽车的成本大幅下降。正是流水线奠定了美国在过去一百年成为“车轮上的国家”的基础,也推动了全球的技术进步和产业升级。流水线(Process)不仅改变了商业模式,推动了技术进步,还改变了我们现代的管理方式。我们今天许多管理方法,实际上也是建立在流水线的基础之上。

因此,对于企业来说,企业流程恰恰是一个企业管理的“流水线”。在数字经济时代,技术范式的创新颠覆了传统认知,进而推动商业模式的深刻变革,同时也带来管理方法的演进。商业模式、管理方法和技术范式这三大核心驱动力的持续变革与相互作用,正在推动企业结合自身优势,构建数字时代的新引擎。而它们的结合点,正是企业的流程——Process。

右边这张图是我曾在《数字化的力量》一书中提到的。数字化时代的企业创新就是数据资产的重新编排,其本质就是流程再造。流程本质上就是业务本身。以银行为例,信贷管理流程本质上就是信贷产品,是银行的核心竞争力。存款管理和总帐管理流程也同样如此。当我们看到AI如何赋能各行各业的时候,重点在于通过AI实现流程再造和优化,帮助企业更深入的结合自身的业务流程实现持续的创新与突破。数据资产不断的组合和业务的不断变化,都需要不断地优化流程、变革流程,从流程为中心切入AI应用,不仅仅是企业数字化转型的重要路径,也是我为什么提出AI加速的数云融合技术愿景的背景。当然,Al for Process也是神州问学发展的战略方向。

现在神州问学的AI Agent的编排空间已经可以作为Al for Process的实现平台,给企业提供一个功能全面、结构化的环境,让企业内部的AI模型能够访问和解析企业内的多源异构数据,帮助企业高效地构建和部署可以扩展的、适配业务需求的业务AI Agent智能体。这些智能体不仅能够精准的理解业务的意图,还能感知动态环境,自主规划任务路径,并通过调用现有的工具、服务接口和API执行操作。

更重要的是,平台能将分散的业务节点不断地组合成新的流程,这样可以让企业在复杂的企业级任务中,通过AI Agent对任务的分解和流程的执行有全面且清晰的理解,从而实现与人和其它系统的协作高效性,以及流程的自动化。

其次,神州问学还可以帮助企业“敲碎”传统的应用。过去我们提到的ERP,包括过去的核心业务系统,在未来的发展中都需要进行碎片化、API化处理。通过将传统业务逻辑细化、模块化并转化为API接口,使其能够被AI Agent直接调用和执行。这使得企业可以更加灵活地拆解和重组现有的系统和流程,获得敏捷的创新能力。未来的企业流程将更多表现为智能体之间的编排与对话。

针对AI在企业流程的应用,2024年神州问学团队发布了相关论文,并成功申请了四项发明专利,创新性地打造了Al for Process框架下的自适应、成本可控、增强性的知识密度提升模块。

可以想象,未来企业流程一定会从传统的、静态的操作模式转变为以智能体为核心的动态编排与协作系统。大家可能不太容易理解这句话的含义。十七、八年前我做产品的时候,最深刻的体会是一个产品的生命周期可能只有几个小时,如当年中国移动春节晚会的短信平台。也就是说,未来的产品和服务形态都将是一种动态编排模式,而这正是AI应用的巨大优势。智能体通过实时交互和任务分发,能够高效完成复杂、跨部门、跨系统的工作,将成为企业运营的主流方式。

微软的CEO萨提亚前几天说,行业内讨论的焦点已经不再是模型本身,而是模型的编排、模型的评估以及如何部署基于这些模型的应用,未来数据的交互和业务逻辑的处理将由AI智能体所主导,这也意味着AI Agent将重新定义整体企业软件生态,SaaS模式将不复存在。

所以,我认为Al for Process是一个重要且核心的AI应用领域,推动以流程为中心的AI应用落地,将企业数据资产与业务需求深度融合,不断优化和革新流程,会成为企业数字化转型的重要路径。

生态合作——神州问学的AI for Process实践

当然,这一过程和目标绝非单个企业能够独立完成。神州数码已经与德勤展开战略合作,共同推出了“AI Factory”概念。此次合作不仅聚焦于人工智能技术本身,更致力于通过企业流程变革实现AI的落地价值。今天,DC·AI希望向大家展示更多应用场景。我们也在与国际、国内领先的人工智能企业、大模型厂商以及AI基础架构厂商展开深入合作,共同探索落地实践。我们希望通过这些努力,让更多的企业从中受益。

半年前,也是在这个房间,我们曾举办过一场座谈会。当时,许多合作伙伴和生态伙伴一致认为,只有联合全球不同领域的企业,共同打造AI生态系统,才能真正推动AI的发展。过去的一年中,神州问学也落地了一些项目,获得了一些经验,有的项目是从知识管理的角度出发,有的是从企业流程 AI for Process的角度出发,有的是从算力管理的角度出发,有的是从Agent的角度出发,都给我们的客户带来了巨大的价值。

我简单举几个例子。就拿刚才我提到的问学团队论文的客户实践案例来说,我们帮助一家商业地产企业以极低的成本实现AI Agent与现有系统的深度集成,将算力成本节约了40倍,团队用Qwen2.5-7B模型,结合数据合成、微调和ASR评估模型反馈技术,将工具选择准确率从基础模型的28.1%,大幅度提升到95.6%,显著超越了GPT-4的88.1%的水平。这就是神州问学在复杂流程自动化应用场景中展现出的卓越能力。

我们还和一个大型的零售电商购物平台合作,基于神州问学的智能体技术,构建了意图识别的基础框架和标准流程。通过整合大模型的能力、智能体工作流的构建、提示工程的分类细化,以及检索增强生成等技术,我们成功地实现了对电商业务中售前、售中、售后等十余类意图以及每一类意图中具体流程参数的精确识别。基于客户方的内部测试结果显示,该项目的整体意图识别精准率和召回率均超过98%,显著优于原有基于规则的问答系统,指标结果明显超出客户预期。此外,在支持业务多并发的情况下,单条问答的平均响应时间控制在三秒钟内。这一成果不仅提升了用户体验,也为企业电商业务实际运营效率带来显著提升。这是我们采用GenAI 技术进行业务流程优化又一个成功案例。

今天在场的有不少来自银行业的朋友们,借此机会,我也想分享一个我们在零售银行业务中的实践案例。我们通过人工智能技术对数据资产进行深度的分析和流程优化,实现了高效的业务流程编排,以大幅度提升客户体验和运营效率。具体来讲,我们利用AI驱动的流程自动化技术,重新设计了客户的交互和内部业务的处理流程,在数据采集和管理层面,通过构建集成化的智能化数据平台,将来自于客户账户、交易记录、消费行为和外部市场动态的海量数据实时汇聚。AI算法可以自动识别关键客户行为模式,生成实时洞察。

在流程编排层面,我们尝试采用AI智能工作流技术,将复杂的客户流程自动化。例如,当一位客户开始查询购房贷款信息时,系统会即时触发AI编排流程:第一步,分析客户信用评分、收入情况和消费习惯,快速生成预审批额度;第二步,根据实时市场数据和客户所在区域房价趋势,定制推荐合适的贷款产品;第三步,通过API将这些信息直接推送到客户的移动银行APP,附上个性化的视频或互动指南,帮助客户更快地完成决策。

如果客户在一定时间内未采取行动,AI系统会自动进入下一步流程,推荐新的方案,如调整贷款利率,或是推荐相关的理财产品,同时该系统还会将用户行为数据反馈至中央数据平台,给未来的优化提供支持。

这种AI驱动的流程编排,不仅简化了客户体验中的每一个环节,还显著缩短了从客户需求识别到产品交付的时间,同时降低了运营成本。我们希望通过这一创新使客户在激烈竞争的零售银行市场中更快、更智能地响应客户需求,充分展示了AI在优化企业流程中的强大潜能。

机会与挑战:中国AI产业长期发展的思考

我们讨论了AI在企业中的通专融合,也探讨了企业AI落地的核心在于流程优化,还了解了神州数码提出的解决方案。然而,这些其实只是冰山一角,还有更多深层次的问题正在影响着我们。这实际上是一个生态系统的挑战。简单来说,就是我们面临的机遇与挑战。

例如,在AI进行数据交换的过程中,我们对数据主权的保障制度仍在不断完善;在围绕AI应用的技术创新方面,仍有大量技术需要进一步集成与再创新;在讨论基础设施时,大模型如何真正成为我们的基础设施,仍是一条漫长的道路。如何高效调用这些基础设施?这些问题既是发展的机遇,也给我们带来了挑战,是所有企业努力奋斗的方向。

最后,回到我今天会议的发言主题——走出一条中国特色的AI发展道路。

我们可以看到,经过四十多年的积累,中国经济已经培育出全球第二大市场。在众多产业中,尤其是大型制造业,我们已经达到了世界领先水平。例如,我国造船业的订单量占全球60%以上,钢铁行业产量占全球50%以上。这些产业在全球的领先地位,正是我们实现“AI for Process”落地发展并实现领跑的坚实基础。

我们也看到,在CES大会上黄仁勋所谈到的AI算力普及化。这种AI算力的普及将极大的激活中国在AI应用上的创新能力。同时,中国作为数据供给和数据消费的大国,也给中国的人工智能可持续发展创造了巨大的机会。

特别是我们也看到这家叫DeepSeek(深度求索)的杭州公司,所展现出创新能力。同样是做大模型,他们走出了一条中国之路。因此,我相信中国人一定会走出一条不一样的路,具有中国特色的AI发展道路。

来源:神州数码集团

相关推荐