摘要:2025年8月21日,CCF TF迎来了第169期活动,主题为“LLM赋能下全程质量管理”。本次活动由CCF TF质量工程SIG策划呈现,邀请到杭银消费金融风控数据质量负责人方佳璐、饿了么质量工具效能组Team Lead项泳彪和华为云AI测试专家范娜等三位讲者
2025年8月21日,CCF TF迎来了第169期活动,主题为“LLM赋能下全程质量管理”。本次活动由CCF TF质量工程SIG策划呈现,邀请到杭银消费金融风控数据质量负责人方佳璐、饿了么质量工具效能组Team Lead项泳彪和华为云AI测试专家范娜等三位讲者。活动以线上直播的形式进行,吸引了众多专业人士的参与。本文将系统梳理本次活动的核心观点与技术洞察,深度解析LLM赋能质量管理的实践路径。
质量工程正面临双重变局:传统管控体系难以应对需求快速迭代与跨系统风险,而大模型技术为质量管理带来智能化转型契机,正以前所未有的深度和广度重塑着软件研发与质量管理的版图。从高风险的金融风控,到高并发的即时零售,再到高复杂度的云计算,AI不再是遥远的概念,而是解决一线痛点、驱动业务增长的核心引擎。为此CCF TF质量工程SIG策划了这次活动,活动主题是“LLM赋能下全程质量管理”,三位来自不同领域的顶尖专家,分享了他们在一线实践中,如何驾驭AI的力量,构建新一代的智能化研发交付体系。
活动开始由同济大学特聘教授、CCF杰出会员、CCF TF质量工程SIG主席朱少民主持,首先朱少民介绍了CCF TF的宗旨和活动安排,随后引导与会者进入主题讨论。
方佳璐:LLM——消费金融风控质量保障的“智能测试助手”
来自杭银消费金融的风控数据质量负责人方佳璐,首先为我们揭示了金融风控领域所面临的独特挑战。这是一个与风险赛跑、与时间竞速的行业。一方面,宏观经济与市场渠道的瞬息万变,要求风控策略必须保持高频迭代;另一方面,贷中审批等核心环节又必须维持毫秒级的响应速度,这对系统的敏捷性和稳定性提出了近乎苛刻的要求。回归测试范围的广度、测试数据的复杂性以及混合架构带来的高技术门槛,共同构成了一道错综复杂的质量保障难题。
面对这一困局,方佳璐的团队引入大语言模型(LLM)作为破局的关键。他们的实践核心,是将LLM打造为一名不知疲倦的“智能测试助手”。在需求分析阶段,通过建立“特征变量需求模板”,结合RAG技术检索内部知识库,LLM能够自动补全模糊信息,确保需求的精准传达。在测试设计环节,LLM的威力更是体现得淋漓尽致,它能基于简单的提示词,在短短十分钟内生成过去需要数天才能完成的、覆盖各种边界场景的测试用例。更具突破性的是,测试人员现在可以通过自然语言描述,让LLM直接生成关联多张数据表的复杂测试数据,极大地降低了技术门槛,让测试更贴近真实的业务分布。
展望未来,方佳璐描绘了搭建AI Agent自动化流水线的蓝图,旨在实现从用例生成到策略优化的全流程自我演进。她强调,成功应用AI的关键在于“批判性地选择应用场景”,并结合企业自身数据进行适配,这为所有希望在金融领域应用AI的同仁提供了宝贵的实践指南。
项泳彪:从标准化到智能化——饿了么的全流程质量管理革命
饿了么质量工具效能组的负责人项泳彪,则带来了即时零售这一复杂场景下的质量管理革命。他坦言,初期的饿了么也面临着行业普遍的痛点:质量数据散落在十几个工具中,难以洞察;缺乏统一的质量门禁标准,导致协同困难;测试用例编写耗时,自动化效率不彰。面对这些挑战,饿了么选择了一条“先固本,后创新”的路径——即先实现标准化,再通过AI赋能。
这一决策的智慧在于,标准化为后续的智能化奠定了坚实的基础。通过统一流程、工具与门禁,团队不仅提升了研发协同效率,更重要的是,在一年多的时间里沉淀了超过六十万份宝贵的文本用例,为AI模型的训练和应用提供了高质量的“养料”。基于坚实的数据基础,AI的应用得以在四大核心场景中全面开花。无论是利用多Agent架构将测试用例生成效率提升40%,还是通过分析代码差异和历史故障来预测高危风险,AI都展现了其精准、高效的特性。尤其在UI自动化执行方面,通过自然语言驱动,彻底摆脱了传统脚本的束缚,不仅将维护成本降低了20%以上,更让业务人员参与自动化测试成为可能。
项泳彪的分享给听众带来的最大启示是,成功的智能化转型并非一蹴而就的技术堆砌,而是一个始于标准化、以数据洞察为罗盘、最终由AI突破效率瓶颈的系统工程。这为同样身处复杂业务环境的企业,指明了一条从“事后补救”迈向“动态调优”的清晰演进路线。
范娜:业务导向与智能自主——华为云构建未来研发交付体系
最后,来自华为云的AI测试专家范娜,则从更高维度,为我们擘画了一幅以业务为导向的、端到端智能化研发交付的宏伟蓝图。华为的研发体系根植于成熟的IPD(集成产品开发)流程,这一体系虽然结构严谨,但在庞大的规模下,依然面临环节强依赖、工具数据分散的挑战。为此,华为云的目标是实现一场深刻的“智控”变革,分三步走:从单点提效的“智能辅助”,到跨团队协同的“智能协同”,最终迈向流程自主决策的“智能自主”。
范娜分享了AI在五大核心场景的深度实践,展现了其重构研发角色的巨大潜力。无论是为不同岗位提供专属的智能问答助手,还是将天级甚至小时级的需求拆解工作缩短至分钟级,AI都在显著降低研发流程的复杂度。其自研的智能编码助手CodeX,集成了代码生成、解释、调试、单测生成等多种能力,已在内部大规模应用,有效帮助新员工快速融入项目。更令人印象深刻的是,其智能代码检视能力突破了单文件分析的局限,能够结合上下文进行深度理解,并提供拟人化的解读与一键修复建议。
这一切强大的应用背后,是华为云坚实的技术底座。近百亿行代码与知识仓库的关联,有效减少了模型的幻觉;而“动态认知净化引擎”和“全链路防护自愈工作流”等创新机制,则确保了AI在生产环境中能够被精准、安全地应用。范娜的分享不仅展示了技术实力,更传递了一种前瞻性的理念:未来的研发交付将从“人控”走向“智控”,AI不再仅仅是工具,而是与开发者并肩作战的“智能伙伴”,共同驱动业务价值的最大化。
三位专家分享完了,由CCF TF质量工程SIG联席主席、华为存储产品线首席测试专家高广达主持问答环节,并做最后总结陈词。
在活动的互动问答环节,三位专家就大模型落地的一线难题给出了精辟解答。针对金融风控中测试数据的质量保障,方佳璐介绍了“大模型生成与人工调优”相结合的模式,利用AI对金融术语的理解力,高效生成高质量数据。面对UI自动化规划耗时的挑战,项泳彪分享了饿了么采用的“缓存机制”,通过复用历史成功用例的规划,避免了不必要的重复计算。而范娜则阐明了AI代码审查的优势:它超越了传统工具的规则限制,能结合上下文和历史故障进行深度理解,并通过“传统工具发现问题,大模型解读并修复”的协同模式,实现效率倍增。
这些实践案例共同指向了本次活动的核心洞见:AI并非要取代传统工程方法,而是要与之深度融合,形成“1+1>2”的协同效应。而这一切成功实践的基石,是高质量、标准化的数据。在落地策略上,从高回报的单点问题切入,被证明是务实且高效的选择。最终,这场技术变革也预示着个人角色的演进:未来,无论是测试、研发还是产品,发现问题的洞察力与善用AI工具的能力,将成为不可或缺的核心竞争力。
关于TF:
CCF 技术前线(TF),是专为企业一线工程师搭建的合作交流平台,通过12个SIG(特别兴趣小组)覆盖架构、人工智能、云原生、安全工程、智能制造等核心领域,聚焦技术落地痛点,助力工程师突破职业瓶颈。
来源:CCFvoice