摘要:在当今高度互联的世界中,移动设备、智能家居和物联网产品正源源不断地产生海量数据,如果能将这些数据充分利用起来,毫无疑问能够为 AI 模型的训练带来更多有价值的养料。但这些数据往往分散在各个终端设备上,在保护隐私的前提下,有效利用这些分散数据训练人工智能模型是一
在当今高度互联的世界中,移动设备、智能家居和物联网产品正源源不断地产生海量数据,如果能将这些数据充分利用起来,毫无疑问能够为 AI 模型的训练带来更多有价值的养料。但这些数据往往分散在各个终端设备上,在保护隐私的前提下,有效利用这些分散数据训练人工智能模型是一个棘手的难题。
传统的联邦学习,比如联邦平均(FedAvg,Federated Averaging)算法,虽然允许多个设备在不共享原始数据的情况下训练模型,但通常假设所有参与者使用相同的模型架构——这一假设在现实世界中很少成立。
在实际部署中,边缘设备在计算能力、内存和网络条件方面差异很大。这种异构性使得要求所有设备训练单一、庞大的模型变得不切实际。
为了解决这一根本限制,三星电子研究员 Honggu Kang 及其合作者开发了生成模型辅助联邦学习(GeFL,Generative Model-Aided Federated Learning),这种新型联邦学习方法能使具有不同 AI 模型架构的设备能够从分散数据中协同学习。
日前,相关论文以《GeFL: 基于生成模型的通用联邦学习》(GeFL: Model-Agnostic Federated Learning with Generative Models)发表在预印本网站 arXiv 上 [1]。Honggu Kang 是第一作者。
图丨相关论文(来源:arXiv)
通过生成模型实现知识共享
GeFL 的技术核心在于,巧妙地利用一个联邦生成模型作为知识传递的桥梁。不同于强制每个客户端共享共同模型,GeFL 允许每个客户端训练自己的目标网络,同时为全局生成模型做出贡献。该生成模型以联邦方式使用各客户端的本地数据进行训练,然后生成合成样本——可以是原始图像或在增强版的中间特征表示——用于增强异构模型的训练。
图丨 GFL 的示意图(来源:arXiv)
Honggu Kang 对此解释道:“我们的框架由两个主要步骤组成。首先是生成知识聚合阶段,各个客户端使用本地数据训练生成模型。服务器收集并聚合这些模型参数,形成一个具有全局知识的生成模型,然后分享给所有客户端。”
在这一阶段,研究团队探索了多种生成模型架构,包括生成对抗网络(GAN,Generative Adversarial Network)、变分自编码器(VAE,Variational Autoencoder)和去噪扩散概率模型(DDPM,Denoising Diffusion Probabilistic Model)。每种模型都有其特点:GAN 能提供高质量、快速的样本生成但容易模式崩溃;VAE 提供多样化但质量较低的样本;DDPM 提供高质量、多样化的样本但计算开销大。
这些生成模型虽然架构不同,但在 GeFL 框架中扮演着相同的角色:它们学习捕捉分布在不同客户端上的数据特征,并通过生成合成样本来传递这些知识。通过联邦学习方式训练,这些模型能够整合来自不同设备的知识,而无需直接访问原始数据。
“第二阶段是目标网络训练和精炼。”Kang 继续解释道。“每个客户端使用全局生成模型产生的合成样本来增强其本地训练数据。具体来说,我们的算法会对随机标签条件下生成样本,将这些样本作为额外的训练数据,多个本地训练周期后,再用真实数据进行精炼。”
这种双阶段方法不仅支持设备根据自身能力定制模型,还通过捕捉更广泛的数据分布显著提升了模型性能。研究团队的理论分析表明,这种生成模型驱动的知识聚合方式能有效缓解个别客户端数据不足和过拟合问题。
在实验评估中,GeFL 在多个公共数据集上进行了测试,包括 MNIST、Fashion-MNIST 和 CIFAR10。结果显示,与基线方法 FedAvg 相比,在 MNIST 数据集上,GeFL 使用 FedDDPM(w=0)达到了 96.44% 的准确率,比 FedAvg 的 92.62% 提高了 3.82 个百分点。在 Fashion-MNIST 上,GeFL(FedDCGAN)达到 83.11%,超过 FedAvg 的 80.58%。在 CIFAR10 数据集上,GeFL(FedDDPM)达到 59.36%,而 FedAvg 仅为 55.65%。
图丨 GFL 在 MNIST、FMNIST 和 CIFAR10 数据集上的平均分类准确率(%)评估(来源:arXiv)
“在评估性能时,我们发现一个有趣的现象,”Kang 分享道,“生成模型的初始距离和初始得分等传统指标与下游任务性能并没有明显相关性。这表明,评估生成模型在联邦学习中的作用需要一个更全面的视角,而不仅仅关注生成图像的质量。”
在研究过程中,该团队发现了一个关键问题。Kang 回忆说:“我们进行了一系列隐私评估后,发现了一个严重的问题。数据明确显示,我们的生成模型虽然强大,但也在合成新样本时保留了太多关于个别数据点的信息。这不仅令人惊讶,还成为了我们研究的一个重大转折点。”
这一发现促使团队重新思考方法。Kang 解释:“认识到保护隐私的重要性,我们决定开发一个增强框架,即特征级生成模型辅助联邦学习(GeFL-F,Feature-level Generative Model-Aided Federated Learning)。在 GeFL-F 中,我们不再生成原始图像,而是转向特征生成模型,这些模型生成的是更低分辨率、抽象的表示。”
增强隐私保护的特征级联邦学习
GeFL-F 的核心创新在于网络分解方法。它将目标网络拆分为两部分:共同特征提取器和特定于模型的头部。特征提取器是所有客户端共享的轻量级组件,通常由一个或几个卷积层组成,负责将原始图像转换为中间特征表示。这些特征表示比原始图像尺寸小得多,信息更为抽象,从而减轻了隐私泄露风险。
模型头部则是专门针对各种模型架构定制的,负责将特征映射到最终预测。这种分解策略允许客户端在共享部分知识的同时,保持模型架构的多样性。在实验中,对 MNIST 和 Fashion-MNIST,特征提取器输出 16×16 大小的特征图;对 CIFAR10 等更复杂的数据集,输出 8×8 特征图。这种设计在信息提取和隐私保护之间取得了良好平衡。
图丨 GFL-F 算法的示意图(来源:arXiv)
GeFL-F 的训练过程分为三个紧密相连的阶段。首先是预热阶段,专注于训练共同特征提取器。在这一阶段,服务器将当前特征提取器和头部参数分发给客户端,客户端使用本地数据训练完整模型,然后上传更新后的参数。服务器分别聚合特征提取器和头部参数,确保参数聚合的一致性。这一过程持续数轮通信,直至特征提取器收敛,为后续阶段奠定基础。
第二阶段是特征生成模型训练,这是 GeFL-F 的关键创新。客户端使用训练好的特征提取器处理本地数据,生成特征表示,然后在这些特征上训练生成模型。与原始 GeFL 不同,这些生成模型学习的是特征空间分布而非图像空间分布。由于特征维度远低于原始图像,生成模型更容易学习,所需参数量也大幅减少,提高了通信效率。
最后阶段是目标网络头部训练。客户端使用全局特征生成模型生成合成特征,基于这些合成特征训练网络头部。随后,客户端使用从本地数据提取的特征进一步优化头部。这种方法让客户端能够学习超出本地数据范围的知识,同时保持模型架构的多样性。
通过这种特征级生成方法,GeFL-F 显著增强了隐私保护能力。实验结果证明,在客户端数量增加的情况下,GeFL-F 显示出更强的鲁棒性,同时在隐私保护方面也有显著改善。通过测量平均最近邻距离(MND,Mean Nearest Neighbor Distance)比率,研究团队发现使用特征生成模型显著降低了记忆化问题。
“为了验证特征生成模型的隐私保护能力,我们尝试用模型反转技术从生成的特征重建原始图像。”Kang 表示,“结果显示,与 GeFL 相比,重建图像的质量显著下降,证实了我们的方法确实加强了隐私保护。”
值得注意的是,GeFL-F 不仅增强了隐私保护,还在资源效率方面展现出优势。特征级生成模型的参数量和计算成本都显著低于原始图像生成模型。这些改进使得该框架更适合资源受限的边缘设备,提高了实际部署的可行性。
图丨 GFL 和 GFL-F 在隐私、通信和计算成本方面的比较(来源:arXiv)
努力实现基于设备能力的自适应量化联邦学习
这项技术的潜在应用相当广泛,尤其在数据分散且设备异构的领域。
例如,在医疗诊断领域,可穿戴监测器、便携式成像设备和移动健康应用等医疗设备的计算资源通常受限。GeFL 可以让这些设备训练个性化模型,同时受益于全局知识池。合成数据的使用帮助缓解数据稀缺和隐私问题,确保患者数据保持机密。
另一个重要应用领域是自动系统和物联网环境,如自动驾驶汽车或智能城市,设备在处理能力上差异显著。GeFL 有助于每个设备训练适合其能力的模型,同时利用全局洞察,增强安全性和操作可靠性。
Kang 特别强调了在数据有限环境中的应用:“在数据稀缺或难以获取的情况下——如在遥感或罕见疾病诊断中——用合成样本增强训练数据可以显著提高模型性能。我们的实验表明,当真实数据量有限时,GeFL 的性能增益更为显著。”
目前,Honggu Kang 博士已加入三星电子担任研究工程师。此前,他曾先后毕业于在韩国汉阳大学与韩国科学技术院。
图丨 Honggu Kang(来源:arXiv)
谈到自己的研究历程,Honggu Kang 分享道:“大学时代,我被算法解决实际问题的魅力深深吸引。我清晰记得第一次成功实现自主导航小车的那一刻——看到简单算法如何从数据中提取有用信息的过程让我着迷,这推动我深入探索计算机科学和数学领域。”
“读研期间,我有幸遇到了鼓励创新思维的导师,他教会我从多角度思考问题、挑战传统观念。第一次接触分布式学习概念是个转折点——在保护隐私的同时,让分散数据源协同训练模型的想法激发了我的创造力,最终引领我开发了 GeFL。”
未来,Kang 将探索更多隐私增强技术,如差分隐私和模型反转防御机制。同时,他们计划将框架扩展到更大规模、更多样化的部署环境,优化极端异构条件下的聚合策略。
“尤其让我兴奋的是一个全新研究方向:基于设备能力的自适应量化联邦学习。通过为不同硬件能力的设备定制量化级别,我们希望在保持模型性能的同时,优化通信效率和计算资源利用。”
Kang 最后表示:“GeFL 不仅是技术创新,更是建设更包容、更适应性强的 AI 生态系统的重要一步。通过让不同架构的设备能够有效协作,我们能将深度学习的好处带给更广泛的设备和应用场景。”
参考资料:
1. https://arxiv.org/abs/2412.18460
阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”
未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问进入。
截止到2月28日 ”未来知识库”精选的100部前沿科技趋势报告
《核聚变,确保 21 世纪美国的主导地位的关键技术》
《世界知识产权组织:2025WIPO 技术趋势报告:交通运输的未来(145 页)》
《世界知识产权组织(WIPO):2024 年世界知识产权指标报告(194 页)》
《联合国环境规划署:2024 年保护地球报告(81 页)》
《联合国工发组织:2024 清洁技术创新能力建设框架研究报告(51 页)》
《凯捷:Applying TechnoVision 2025:未来科技趋势及应用愿景(17 页)》
《谷歌:2025 年 AI Agent 白皮书:AI 智能体时代来临(42 页)》
《富而德律师事务所:2024 年国际仲裁趋势年度回顾报告(41 页)》
《邓白氏:2024 年全球企业破产报告(27 页)》
《LLM 时代小模型的应用潜力与挑战 》(50 页)
《斯坦福 2025 斯坦福新兴技术评论十项关键技术及其政策影响分析报告》(英文版 191 页)
《英伟达:2025NVIDIA 自动驾驶安全报告(26 页)》
《微软 MICROSOFT (MSFT) 2024 年影响力摘要报告(23 页)》
《高德地图:2024 年中国主要城市交通分析报告(29 页)》
《德勤 & CAS:2025 锂离子电池回收行业报告 - 面向绿色未来的市场及创新趋势(36 页)》
《ABI Research:2025 生成式人工智能在语义和实时通信中的应用研究报告(20 页)》
《2025 年 3D 打印技术发展趋势、产业链及相关标的分析报告(45 页)》
《生成式基础模型的可信度 —— 指南、评估与展望》(231 页)
《量子信息科学与技术对国家安全的影响》(118 页)
《中国科学技术信息研究所:2024 科技期刊世界影响力指数(WJCI)报告(68 页)》
《思略特(Strategy&):2025 汽车行业的人工智能(AI)机遇研究报告(12 页)》
《赛默飞:2024 年中国生物科技行业调研报告:资本寒冬中生物科技企业的生产之道(18 页)》
《清华大学:2025 年 DeepSeek 与 AI 幻觉报告(38 页)》
《美国企业研究所(AEI):2025 创新未来电力系统研究报告:从愿景迈向行动(71 页)》
《超材料的智能设计研究进展》
《Ember:2030 年全球可再生能源装机容量目标研究报告(29 页)》
《量子信息科学与技术对国家安全的影响》
《英国人工智能安全研究所:2025 年国际人工智能安全报告 - 执行摘要(22 页)》
《世界海事大学:2024 海事数字化与脱碳研究报告:可持续未来(250 页)》
《艾睿铂(AlixPartners):2024 回溯过往锚定未来:大型科技公司如何推进人工智能愿景研究报告(18 页)》
《Wavestone :2025 数据与 AI 雷达:掌握数据与人工智能转型的 10 大挑战研究报告(30 页)》
《CSIS:2024 中美学术的再联结研究报告:在激烈竞争的时代增进相互理解(120 页)》
《MSC:2025 全球国防创新就绪度差距系列报告:突破制约国防创新的六大隐性障碍(第四版)(32 页)》
《2025 年 AI 编程发展前景及国内外 AI 编程应用发展现状分析报告(22 页)》
《中国核电 - 公司深度报告:世界核电看中国 - 250218(22 页)》
《医药生物行业:医疗器械行业全景图发展趋势及投资机会展望 - 250216(28 页)》
《皮尤研究中心:2024 美国社交媒体使用情况研究报告(英文版)(30 页)》
《科睿唯安:2025 基因编辑领域的领先创新者洞察报告 - 改变药物发现和开发范式的八大创新者(47 页)》
《经合组织(OECD):2025 年全球脆弱性报告(218 页)》
《计算机行业年度策略:AI 应用元年看好 Agent、豆包链及推理算力三大主线 - 250218(38 页)》
《国金证券研究所:从理想走向现实,全球人型机器人研究报告》
《深度解读 DeepSeek 原理与效应(附 PPT 下载)》
《兰德公司(RAND):2025 借鉴危机经验构建城市水安全韧性研究报告:五城案例分析(62 页)》
《凯捷(Capgemini):2025 行业创新洞察:电气化飞机推进系统研究报告(27 页)》
《国际能源署(IEA):2025 全球电力市场报告:至 2027 年的分析与预测(200 页)》
《Zenith:2025 年国际消费电子展(CES)趋势报告:AI 对消费科技、消费行为及传媒营销的变革性影响(17 页)》
《RBC 财富管理:全球透视 2025 年展望报告(33 页)》
《美国国防部和国家安全领域的十大新兴技术》(96 页)
《代理型人工智能全面指南》(45 页 ppt)
《麦肯锡 2025 人类工作中的超级代理。赋能人类解锁 AI 的全部潜力》(英文版 47 页)
《仲量联行(JLL):2025 美国制造业的复兴全面分析报告:未来制造业增长及工业需求前瞻(26 页)》
《未来的太空领域:影响美国战略优势的领域》
《Luminate:2024 年年终美国影视行业报告:数据及趋势洞察(40 页)》
《Anthropic:2025 年 AI 经济影响报告:AI 如何融入现代经济的各类实际任务(38 页)》
【ICLR2025】《LLMS 能否识别您的偏好?评估 LLMS 中的个性化偏好遵循能力》
《改进单智能体和多智能体深度强化学习方法》(219 页)
《美国安全与新兴技术中心:2025 中国学界对大语言模型的批判性思考通用人工智能 AGI 的多元路径探索研究报告》(英文版 29 页)
《世界经济论坛 & 麦肯锡:2025 以人才为核心:制造业持续变革的当务之急研究报告(40 页)》
《超越 ChatGPT 的 AI 智能体》(82 页 ppt)
《Harris Poll:2024 年汽车技术预测报告:消费者对先进汽车技术与功能的洞察(14 页)》
【新书】《人工智能智能体的应用》(527 页)
《哥伦比亚大学:超越 Chatgpt 的 AI agent 综述》
《欧盟标准组织 - 体验式网络智能(ENI)- 基于人工智能代理的下一代网络切片研究》
《中国科学院:2024 开放地球引擎(OGE)研究进展与应用报告(55 页)》
《中国工程院:2024 农业机器人现状与展望报告(70 页)》
《美国安全与新兴技术中心:2025 中国学界对大语言模型的批判性思考:通用人工智能 (AGI) 的多元路径探索研究报告(29 页)》
《罗兰贝格:2050 年全球趋势纲要报告之趋势五:技术与创新(2025 年版)(72 页)》
《理特咨询(ADL):2025 解锁聚变能源:驾驭聚变能商业化的机遇与挑战研究报告(20 页)》
《埃森哲:技术展望 2025—AI 自主宣言:可能无限信任惟先 - 摘要(12 页)》
《怡安(AON):2025 年气候和自然灾难洞察报告(109 页)》
《美国安全与新兴技术中心:2025 AI 翻车事故(AI incident):强制性报告制度的关键要素研究报告(32 页)》
《牛津经济研究院 2025 确保英国充分释放量子计算的经济潜力研究报告 》(英文版 64 页)
《欧洲创新委员会(EIC):2024 年科技报告(65 页)》
《大模型基础 完整版》
《国际人工智能安全报告》(300 页)
《怡安(AON):2025 年全球医疗趋势报告(19 页)》
《前瞻:2025 年脑机接口产业蓝皮书 —— 未来将至打造人机交互新范式(57 页)》
《联合国(United Nations):2024 技术与统计报告:从业者投资法指南(67 页)》
《经济学人智库(EIU):2025 全球展望报告:特朗普再次当选美国总统的全球影响(16 页)》
《大规模视觉 - 语言模型的基准、评估、应用与挑战》
《大规模安全:大模型安全的全面综述》
《Emplifi:2024 年 Q4 全球电商行业基准报告 - 社交媒体趋势洞察(37 页)》
《DeepMind:2025 生成式魂灵:预测人工智能来世的益处和风险研究报告(23 页)》
【AI4Science】《利用大型语言模型变革科学:关于人工智能辅助科学发现、实验、内容生成与评估的调研》
《世界银行:2025 极端天气高昂代价:气候变化背景下的马拉维金融韧性构建研究报告(76 页)》
《北京理工大学:2025 年中国能源经济指数研究及展望报告》
《Space Capital:2024 年第四季度太空投资报告(22 页)》
《NetDocuments:2025 年法律科技趋势报告(32 页)》
《CB Insights:2024 年度全球企业风险投资(CVC)状况报告:私募市场交易、投融资数据及分析(130 页)》
《Artlist:2025 年全球内容与创意趋势报告(59 页)》
《IBM 商业价值研究院:2024 投资人工智能伦理和治理必要性研究报告:AI 伦理前线五位高管的真实故事(24 页)》
《世界基准联盟(WBA):2025 塑造未来:对可持续发展目标(SDGs)影响最大的 2000 家公司研究报告(46 页)》
《清华大学:2025 年 DeepSeek 从入门到精通(104 页)》
《麦肯锡:2025 工作场所中的超级代理 (Superagency):赋能人类解锁人工智能的全部潜力(47 页)》
《凯捷(Capgemini):科技愿景 2025:关键新兴科技趋势探索(54 页)》
《硅谷银行(SVB):2025 年上半年全球创新经济展望报告(39 页)》
《BCG:2025 工业运营前沿技术:AI 智能体 (AI Agents) 的崛起白皮书(26 页)》
《DrakeStar:2024 年全球游戏与电竞行业报告(26 页)》
《理特咨询(ADL):2025 人工智能驱动的研究、开发与创新突破的新时代研究报告(80 页)》
《互联网安全中心(CIS):2024 年网络安全冬季报告:回顾与展望(30 页)》
《方舟投资(ARK Invest):Big Ideas 2025 - 年度投研报告(148 页)》
《DeepSeek:2024 年 DeepSeek-V2 模型技术报告:经济、高效的混合专家语言模型(52 页)》
《CB Insights:2024 年度全球风险投资状况回顾报告:私募市场交易、投融资和退出数据及分析(273 页)》
《全国智标委:2025 城市生命线数字化标准体系研究报告(105 页)》
《经合组织(OECD):2024 年全球政府创新趋势报告:促进以人为本的公共服务(46 页)》
《DeepSeek_R1 技术报告》
《摩根斯坦利报告 —DeepSeek 对于科技和更广义经济的含义是什么?》
《李飞飞最新 S1 模型的论文:s1 Simple test-time scaling》
《世界经济论坛 -《全球经济未来:2030 年的生产力》报告》
《2035 年技术融合估计:量子互联网、人机接口、机器学习系统、隐形机器人、增材制造》
《百页大语言模型新书》(209 页 pdf)
《量子技术和网络安全:技术、治理和政策挑战》(107 页)
《大语言模型中的对齐伪造》(137 页)
《2035 年技术融合估计:量子互联网、人机接口、机器学习系统、隐形机器人、增材制造》(美陆军 232 页)
《美国防部 CDAO:人工智能模型的测试与评估》(66 页 slides)
《自动驾驶的世界模型综述》
《Questel2024 深度学习领域专利全景报告》(英文版 34 页)
《深度解析 Palantir》(20250122_204934.pdf)
上下滑动查看更多
来源:人工智能学家