AI 渗透金融行业:大模型如何破解风控、服务与决策难题?

B站影视 日本电影 2025-06-10 17:38 1

摘要:在数字化浪潮与人工智能技术双重驱动下,金融行业正经历从“效率优化”到“价值重构”的深刻变革。那么,如何利用大模型分析海量金融数据提升风险评估准确性?如何实现个性化服务以提升客户满意度?

作者 | AICon 全球人工智能开发与应用大会

策划 | 李忠良

编辑 | 宇琪

在数字化浪潮与人工智能技术双重驱动下,金融行业正经历从“效率优化”到“价值重构”的深刻变革。那么,如何利用大模型分析海量金融数据提升风险评估准确性?如何实现个性化服务以提升客户满意度?

近日 InfoQ《极客有约》X AICon 直播栏目特别邀请了奇富科技首席算法科学家费浩峻担任主持人,和平安人寿总监魏政刚、同盾科技副总裁董纪伟、蚂蚁数科高级算法专家齐翔一起,共同探讨大模型如何赋能金融行业。

部分精彩观点如下:

大模型目前能很好地辅助工作,但在强决策领域,仍然无法独立完成任务。

为了抑制幻觉,关键在于提高供给侧数据的可靠性,并优化智能体的推理过程。

解决工程问题需要四个关键要素:对业务问题的理解、AI 任务的清晰划分、知识体系的构建、以及结果评估标准。

以下内容基于直播速记整理,经 InfoQ 删减。

金融服务范式创新

费浩峻:当前在金融行业中,哪些是大模型应用最广泛、最具代表性的场景?

魏政刚:春节后,DeepSeek 的崛起给我们带来了新的思路与变化。平安早期便大力投入大数据和 AI,并积累了丰富经验。DeepSeek 的推理能力显著提升,且开源性使成本不再是限制因素,从而在各个业务环节实现了更广泛的应用。

在保险行业,尤其是人寿保险领域,大模型在全价值链,例如营销销售、核保、理赔、客户服务和投资等环节的应用已经非常深入。除此之外,我们还将其应用于文档生成、文件解读、财务和投资报告等方面。

范式转变主要体现在效率提升和任务自动化,许多原本需要人工干预的简单任务,现在已实现 100% 的自动化。这种变化从局部应用转向了系统性的整体提升,主要体现在提高效率、降低成本和部分场景质量的提升。

齐翔:一类是面向消费者(ToC)的应用,主要包括财富管理、保险营销和投资教育等对话型机器人。大模型的加入提升了用户体验,尤其是在多轮对话、意图辨析和信息查询等方面,效果远超传统机器人,商业效果也更为显著。技术上,传统的意图提取和剧本编写被大模型简化,开发者的工作变得更加轻松。

另一类是面向专业人士(ToP)的应用,主要是为企业员工或专家提供素材生产,例如投研报告、财报分析和风控报告的写作。甚至大模型已被用来训练机器学习模型,替代部分算法专家的工作。在没有大模型和智能体之前,这些任务完全依赖人工,现在机器也能承担很多工作,极大提高了研发的投入产出比。

董纪伟:大模型在应用上逐步从后端走向中端、前端,原来主要是代码助手和智能问答的交互及生成报告,现在则更加注重细化到具体场景中应用。其次,无论是外部知识库还是微调模式,场景应用越来越深入。尤其是在高频高价值场景中,大模型已经开始发挥重要作用,类似在客户价值评估、营销和渠道管理、智能风控的应用也逐渐增多。大模型的相关技术使得智能体具备了自我学习、进化以及流程化编排的能力,能够处理更多非结构化的富文本数据,并结合如知识图谱的技术提升知识生成与推理能力。

另外,基于实时流数据,风控系统不仅能进行二分类预测,还能提供预测概率,衡量风险因素。随着流程的不断优化,新一代的风控系统能够根据不同场景做出自主决策并自我优化。如今,这种能力在金融行业的价值评估和风控领域越来越重要,成为最热门的应用之一。

费浩峻:在这些应用场景中,大模型的技术渗透程度如何?是否已经带来了业务模式的深度变革?具体体现在哪些方面?

魏政刚:这也是我在此次会议中想讨论的问题:以大模型为代表的 AI 浪潮,是颠覆性力量还是持续进化的力量?颠覆性的标准一般来看,是否有新的基础要素的出现,是否有新的基础要素组合方式的出现,以及这些“出现”产生的显著价值。在保险行业,尤其是人寿保险,即使今天我们有其他模式,如银保模式,保险销售的主要方式仍然是通过代理人。因此,商业模式没有发生根本变化,主要关注的是提高运营效率,尤其是决策、运营和管理效率。在科技研发方面,尽管像谷歌等公司已经在人工智能中取得了一定进展,但整体上我们仍未看到大规模的颠覆。目前来看,大模型更像是一种进化力量,虽然在部分业务场景中,如简单的判断和推理任务,已经有了超过 50% 的替代效应,但从整体业务流程来看,尚未出现完全替代人工的情况。

齐翔:过去,很多模型需要通过收集样本和训练来完成任务,但在大模型时代,很多任务,已经可以通过零样本或少样本的方式完成。因此,大模型在技术渗透上已经非常深入,关键在于选择使用哪种规模的模型。

但从业务模式的角度来看,虽然大模型在辅助工作中表现出色,但在需要强决策的场景(如信贷审批和投资决策)中,仍然不能完全独立承担任务。例如,风控模型训练仍需要专家进行策略调整。金融和医疗行业尤为突出,因为它们的决策涉及很大的责任,伦理问题也需要考虑。

董纪伟:在金融行业,虽然不能确定最终是否会颠覆,但大模型的应用确实在反欺诈、监管科技和对公决策中发挥了重要作用。传统的数据处理主要依赖结构化数据,非结构化数据的应用较为有限。而现在,大模型不仅辅助决策,还能增强数据校验、减少信息差,提升数据一致性,尤其在大对公和时效要求不高的场景中,大模型的增益效果愈加显著。在信贷审批和风险评估等场景中,大模型不仅能辅助决策,还能在一些决策流程中独立运行,提供与专家评分卡不相上下的结果输出。尤其在信贷领域,大模型的应用大幅提升了逻辑性和准确性。

尽管大模型的应用降低了算力和资源成本,但在实时决策中,由于响应时效性较差,仍需结合流计算框架进行优化。通过将实时决策和大模型辅助决策结合,能够提升决策的准确性和灵活性。最终,在风险决策中,大模型并不是完全替代人工,而是大大提高了决策效率和精准度。虽然实时决策仍面临挑战,但通过与自学习机制结合,可以实现更精确的风控和决策辅助。

技术破局与落地

费浩峻:在金融决策场景中,模型的可解释性与性能之间往往存在矛盾。这种情况下,我们应如何权衡二者?又该如何建立对 AI 决策结果的信任机制?

齐翔:关于可解释性和性能之间的矛盾,这个问题并非大模型时代特有,算法领域一直存在,大模型带来了一些新的思路,我认为存在两类决策,其解释机理不同:一是认知层面的推理辨析,二是统计分析决策。

认知层面的推理辨析最典型的例子是合规条款辨析。这件事人能够兼顾效果和解释,因为其决策是能够用一段自然语言描述清楚 what & why 的,大模型能够跟人一样描述清楚思考过程,从而兼顾决策准确性和可解释性。

另一类偏统计的分析决策,如信用风控中的授信决策,想要做的准得基于统计学习的概率估计来做阈值决策,而不是自然语言思考,连人都难以完美解释这样的决策。因此我倾向于让小的判别模型进行决策,而大模型则作为辅助工具,帮助提供解释理由。大模型能在一定程度上弥补小模型的解释能力,但需要注意它可能带来的幻觉效应。

董纪伟:在使用大模型时,性能不足通常通过使用更大预训练模型或微调来提升表现,或者通过优化推理过程提高响应速度和计算效率。在可解释性方面,我们的尝试是通过结合大模型与小模型的方式来解决问题。例如,在风控和营销等应用中,使用小模型来增强可解释性,并将大模型作为辅助工具进行决策。这是常见的操作方式。

可解释性可以通过特征层面的分箱、WOE 等方法增强,同时,结合大模型和小模型的选择,能够在不同场景中实现性能和可解释性的平衡。此外,知识图谱也在增强可解释性方面发挥较好的作用,通过图谱中的知识推理和关系权重传播,提升模型的可解释性。

尽管大模型的技术更新迅速,传统的小模型和知识图谱依然有其独特作用,通过有效结合,可以在算法和场景层面实现最佳平衡。

魏政刚:在谈可解释性时,我们需要明确是谁需要解释。历史上,人工智能经历了从概率统计到专家系统、判别式 AI 再到生成式 AI 的演变,我认为可解释性在逐步增强。

生成式 AI 的高维和超维参数超出了人类的理解范围,但它允许我们查看推理过程,理解其得出结果的步骤,因此,从操作层面上,它的可解释性比判别式 AI 更强。

然而,在某些应用场景中,生成式 AI 并不适合使用,反而可能增加混淆。可解释性的问题需要根据不同的受众来衡量。今天的消费者,尤其是 90 后、00 后,数字生态下成长起来的一代,对大模型的可接受性更高,具备一定的知识储备,因而可解释性对他们而言可能更为容易。

谈到大语言模型的性能,幻觉问题是复杂场景中出现的一个挑战。大语言模型通常只是一个解决方案的一部分,结合其他方法和框架可以确保整体效果。

大语言模型的预训练和反应速度的限制使其吞吐量较低,且不如传统方法直接响应。但不同场景下的应用效果决定了其优势。最终,我认为可解释性和性能是两个独立的概念,不必对立。

费浩峻:金融行业对“准确性”和“可靠性”要求极高,而大模型本身存在“幻觉”问题。面对这一挑战,可以从哪些维度入手进行改进和控制?

董纪伟:数据在大模型的应用中至关重要,特别是贴近场景的数据更具价值。大模型的有效性不仅依赖于算法和算力,还需要高质量的数据支持。

关于数据,有两点需要关注:首先,大模型依赖的数据必须确保安全性和合规性。对于这一点,私有化部署的大模型在安全性上最为可靠,但这种方式也有局限。为了保证数据质量、合法性和合规性,可以考虑传统的数据加密方法、多方安全计算、联邦学习等技术。

其次,大模型的流程逻辑中需要关注模型的安全性。生成内容是否偏差、是否符合道德和安全要求,需要加入过滤和监控机制来减少数据偏差的影响,确保内容合规。

随着大模型的快速发展,数据治理和安全性问题越来越突出。无论是 ToC 还是 ToB 领域,数据治理是确保大模型可靠运行的重要一环。

魏政刚:大语言模型 = 算法 + 算力 + 语料。这三个要素结合在一起,应用于不同场景,成就了今天的 AI 浪潮。数据是生成知识,特别是文本类数据的重要资源,尤其在中国市场,数据的质量和数量都是关键。这就是为什么我们强调做知识图谱和知识体系,将垂直领域的知识固化,交给机器学习。数据不仅是量的问题,隐私是其中的重要课题,涉及 AI 伦理和未来 AI 与人类对齐的问题。

这对于金融行业特别重要,因为关系到人身财产安全。目前,虽然大语言模型已经崛起,但监管法律仍有滞后,尤其在消费者隐私保护方面。金融行业本质上是关于资本和风险的,虽然技术手段如隐私计算和联邦学习可以在一定程度上应对信任问题,但我们仍然需要法律法规来确保其安全与合规,并对消费者进行深度保护。

齐翔:我在金融智能体项目中常接触幻觉问题。金融行业对准确性和可靠性要求极高,对错误零容忍。我们可以将智能体视为一个函数,其中数据和工具集是输入,智能体的推理过程是函数部分。为了抑制幻觉,关键在于提高供给侧数据的可靠性,并优化智能体的推理过程。

首先,供给侧数据的可靠性至关重要。举例来说,一些低质量的文档或者过于专业的文档,难以直接应用于大模型。我们可以通过提纯加工和 FAQ 抽取等方法来优化数据质量,使其更加适用于智能体的工作。

其次,智能体的过程也需要可控。在感知层面,结构化理解用户问题、精准检索相关知识,能够大大提升智能体的准确性并降低幻觉风险。决策过程中,需要遵循标准化操作(SOP)来确保决策的可靠性,避免过度推理或不一致的答案。

在行动层面,金融领域要求智能体严格遵循检索知识,而非内生知识,确保信息来源的权威性。同时,智能体的输出应具备结构化的表达,例如总分总结构或观点先行的格式。

费浩峻:智能体(Agent)作为大模型的重要延伸,在金融场景中的实际应用效果如何?取得了哪些成效?在实际部署过程中,遇到了哪些关键技术或工程挑战?团队是如何应对并解决这些问题的?

魏政刚:智能体需要具备以下能力:反思能力、工具使用能力、规划能力和协同能力。这些特性使得智能体不仅仅是一个任务执行的工具,而是超越了传统科技开发范式的工程解决方案。

在实际应用中,智能体的首要任务是理解问题。通过理解问题,我们可以决定何时调用任务,何时让智能体自己进行规划,何时需要多个智能体协同工作。这对我们来说,意味着不仅仅是将任务交给机器,而是对人类能力提出更高要求——包括抽象能力、分析能力和批判性思维能力。

解决工程问题需要四个关键要素:对业务问题的理解、AI 任务的清晰划分、知识体系的构建、以及结果评估标准。大模型的应用依托于这些。以 IT 运维为例,我们通过智能体和工作流框架处理大量的系统问题。通过自动化分类和筛选,我们能够将问题处理效率大幅提升,最终将处理时间从数小时缩短到几分钟。

在实现这一过程时,我们结合了知识库、逻辑判断、传统技术和大模型,使得整个系统能够高效运作。一个企业级的工程项目并非仅仅依赖大模型,而是要结合过去的经验和多种技术手段。

当前的人工智能产品,如聊天机器人,往往不是简单的大语言模型。它们包含了多种流程和机制,包括防止幻觉的检测和合规性检查,整体解决方案需要结合多个领域的技术和经验。

董纪伟:智能体的应用在金融行业尤其重要,特别是在风控和风险决策中。智能体不仅仅依赖大模型,还结合了传统的决策引擎、知识图谱等技术,能够完成自适应和可量化的任务。每个场景,如对公业务、零售或反欺诈等,都有不同的决策流程和需求。

智能体的关键在于感知、规划和执行的能力。通过感知,智能体能识别问题并进行流程决策规划,自适应和可量化的能力能够更好地应对不同的场景和风险类型。技术支撑已经到位,但实现真正自适应和可量化的能力仍需要结合实时数据源和外部因子的定性,如舆情或市场变化。

在金融科技中,我们使用智能体进行策略自动生成和自迭代。通过结合政策和监管信息,智能体可以识别和解决信息差,并在实时数据变化时自动调整决策链路。这种能力使得智能体能够应对风险的动态变化,并驱动风控策略的优化。

智能体的结构可以是一个大流程,也可以是多个小场景的组合。根据不同场景的需求,我们可以拆分大问题并进行差异化处理。风险决策的精准度和模型的微调在其中起到关键作用。

解决模型幻觉问题时,结合多维数据输入和精细化流程是关键。通过平衡模型间的决策增强、微调和提示词模板的构建,可以提升模型的精度和可解释性,从而在风控和其他金融场景中实现更高效的决策支持。

齐翔:在金融领域,智能体的典型落地应用可以从 ToC 和 ToP 两个方向来看。ToC 方向的一个例子是支付宝的蚂小财智能体,它能理解用户意图,分析基金配置、保险等问题,并提供建议。用户可以通过这一应用体验智能体在决策和推荐方面的能力。

在 ToP 方向,智能体也被用来做风控建模,这原本是人工专家的任务。如今,智能体能够理解用户意图、分析数据并编写代码,执行机器学习链路、AutoML 任务(如模型结构搜索、超参数调优、特征工程)。例如,在特征工程中,智能体能分析现有特征并建议缺失的特征,甚至自己生成新的特征,提升模型的表现。

智能体在特征工程中的优势在于能够进行递归性搜索,结合启发式分析,超越传统的 AutoML 方法。与人工操作相比,智能体在提升模型准确性(如 KS 指标)和建模效率上都有显著优势,能够减少 80% 的人工工作量。

然而,业务挑战仍然存在。智能体并不总能百分百遵循人类的经验和决策规则,这要求我们在行业中加强经验学习和模型优化。

6 月 27~28 日的 AICon 北京站将继续聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent 构建、多模态应用、大模型推理性能优化、数据智能实践、AI 产品创新等热门议题,深入探讨技术与应用融合的最新趋势。欢迎持续关注,和我们一起探索 AI 应用的无限可能!

来源:InfoQ

相关推荐