基于环境语义感知的聚类联邦学习算法

B站影视 内地电影 2025-09-05 14:03 1

摘要:在万物智联的时代,语义通信通过语义信息的精准理解与高效传递,为通信系统注入了更深层次的智能,成为未来通信技术的核心发展方向之一。特别地,通感一体化技术通过将通信与感知进行深度融合,已成为6G的核心应用场景之一。基于环境语义感知的通感一体化技术,能够在保障数据高

【语义通信与语义信息论

基础理论与关键技术】专题

基于环境语义感知的聚类联邦学习算法

,朱慧翔2,31,李莹玉1,4,肖泳2,4

(1.中国地质大学(武汉)机械与电子信息学院,湖北 武汉 430074;

2.华中科技大学电信学院,湖北 武汉 430074;

3.鹏城实验室,广东 深圳 518055;

4.琶洲实验室(黄埔),广东 广州 510335)

【摘 要】在万物智联的时代,语义通信通过语义信息的精准理解与高效传递,为通信系统注入了更深层次的智能,成为未来通信技术的核心发展方向之一。特别地,通感一体化技术通过将通信与感知进行深度融合,已成为6G的核心应用场景之一。基于环境语义感知的通感一体化技术,能够在保障数据高效传输的同时,实现对复杂环境的有效感知,为低空经济、智慧医疗等多种新兴垂直应用场景提供了有力的技术支撑。然而,由于无线信号的统计特征与其地理位置和周围环境具有强相关性,呈现高度异构性,传统的基于联邦学习的分布式环境语义感知算法模型精度、收敛速度等性能较低。通过对在不同地点接收到的无线信号数据分布的相关性进行分析,提出一种基于环境语义感知的聚类联邦学习算法。所提算法通过对不同位置的无线信号数据分布的相似程度进行度量,并据此将采集的无线信号数据集进行聚类然后为每个接收器的本地数据集构建个性化全局模型。基于实测无线感知数据集进行了大量仿真实验,实验结果表明,与传统的基于FedAvg的解决方案相比,所提算法在测试准确率方面提高了约5.05%。

【关键词】语义通信;通感一体化;环境语义特征;聚类联邦学习

doi:10.3969/j.issn.1006-1010.20250605-0001

中图分类号:TN929.5 文献标志码:A

文章编号:1006-1010(2025)07-0036-12

引用格式:沈科同,朱慧翔,陈思怡,等. 基于环境语义感知的聚类联邦学习算法[J]. 移动通信, 2025,49(7): 36-47.

SHEN Ketong, ZHU Huixiang, CHAN Siyi, et al. Clustering Federated Learning Algorithm Based on Environmental Semantic Perception[J]. Mobile Communications, 2025,49(7): 36-47.

0 引言

6G作为下一代通信技术,不仅追求更高的数据传输速率,更致力于实现通信、感知与计算的深度融合[1]。基于通感一体化的未来6G旨在构建能够实现人机智慧互联、智能体高效互通的智慧网络,在为用户提供无缝的通信体验的同时也具备强大的感知能力,能够实时监测和理解周围环境,为低空经济、智慧医疗等多种智能化应用新兴垂直应用的发展提供坚实基础[5]。语义认知网络(SAN, Semantic Aware Network)是6G技术的重要发展方向之一[6]。它通过赋予网络对信息的语义理解能力,使网络能够从海量数据中提取有价值的信息,并根据其语义内容进行智能处理和传输。在语义感知网络中,数据不再是简单的比特流,而是具有明确语义含义的信息单元。这种基于语义的网络架构能够更高效地处理和利用数据,实现对复杂场景的深度理解,为用户提供更加个性化、智能化的服务。语义感知网络的出现,将推动网络从传统的数据传输管道向智能信息处理平台的转变,为6G通感一体化的发展提供了非常强大的技术支撑[9]然而,在通感一体化的应用当中,现有的模型训练主要采用集中式架构,即从有限的几个位置收集数据,并基于这些数据训练一个全局模型,然后将该模型应用于整个考虑区域的更广泛位置和环境。但这种集中式方法忽略了无线信号本身的时空异质性问题,即信号的统计特性会因时间和空间的不同而显著变化[12]。具体来说,无线信号的特性高度依赖于位置、环境和与人相关的因素。例如,发射机、接收机和物体的不同位置,以及房间布局,均会导致信号特性和数据分布的显著差异。传统的集中式架构难以应对这种差异,且随着数据异构性的增加,模型预测精度会有所衰退。为了有效应对上述挑战,提出了一种基于环境语义感知的聚类联邦学习算法。该算法的灵感来源于均匀流形近似与投影(UMAP, Uniform Manifold Approximation and Projection)技术。UMAP能够高效捕捉无线信号的环境语义特征,并将其从高维语义空间映射到低维空间,从而为算法设计提供了独特优势[13]。具体来说,接收器使用UMAP算法将本地的高维数据进行降维后将其发送给协调器,然后协调器用最大均值差异(MMD, Maximum Mean Discrepancy)算法评估这些数据分布之间的距离,形成一个距离矩阵,并据此构建合理的聚类结构。在模型训练阶段当中,各接收器仅需下载和上传与其所属聚类相关的模型,极大地优化了数据传输和计算资源的利用效率。

本文的主要贡献点总结有如下四点:

(1)环境语义特征识别:其中包括动态环境语义和静态环境语义,它们与不同环境之下接收器中的信道状态信息(CSI, Channel State Information)数据分布情况高度相关,同时通过实验将不同环境之下的接收器接收到的无线信号的环境语义特征参数进行估计,将无线信号的时空异质性进行具象化表示。

(2)数据相似度度量:因为无线信号的CSI数据具有高维特性,直接处理高维数据会面临计算复杂度高、数据存储需求大以及模型泛化能力受限等问题,所以对其进行降维处理是非常有必要的。对比了多种降维方式,最后采用UMAP算法接收器中的高维数据进行降维处理,并且利用MMD度量不同接收器上数据分布之间的差异。

(3)基于环境语义感知的聚类联邦学习算法:根据对不同接收器中数据相似度的度量结果进行聚类,提高具有高度时空异质性的无线感知信号数据集的模型收敛速度及精度,并对算法的收敛性进行分析。

(4)基于实测无线感知数据集的仿真实验:为验证所提基于环境语义感知的聚类联邦学习算法有效性,基于实测无线感知数据集进行了仿真实验,结果表明了所提出的算法模型精度优于FedAvg[17]、FedProx(Federalized Proximal Algorithm)[20]和PACFL(Principal Angles analysis for Clustered Federated Learning)[18]等方法;与传统的FedAvg方法相比,所提算法在测试准确率方面提高了约5.05%。

1 环境特征语义提取的系统建模与问题定义

1.1 基于环境语义的无线信号感知系统模型

本文的研究是基于一个环境语义的无线信号感知系统。如图1所示,考虑的系统由一个协调器、一个或多个Wi-Fi发射器和一组部署在所考虑区域不同位置的K个接收器组成。每个接收器记录无线信号传播时被人类用户或周围环境反射和散射所形成的CSI数据。同时每个接收器都有其单独的本地数据,这些数据信息之间不能相互传递,只能在协调器处进行模型参数的聚合,协调器也会向接收器广播其更新的全局模型参数。由于此系统中无线信号的高度时空异质性的影响,不同接收器接收到的无线信号数据分布间会存在一定的差异。进一步而言,假设两个接收器接收到的无线信号数据分布差异较大,它们共用一个全局模型训练则可能会导致模型性能的下降。换言之,如果这两个接收器使用不同的全局模型,可能会达到更好的效果。

1.2 基于环境语义感知的优化问题定义

2 环境语义特征

2.1 环境语义信息

2.2 环境语义特征估计

3 基于环境语义感知的聚类联邦学习算法

3.1 无线信号数据分布相似性分析

3.2 接收器数据特征的提取

3.3 聚类步骤

3.4 模型训练

3.5 收敛性分析

4 实验结果以及分析

4.1 实验平台

为了验证本文的方案在应对无线信号高度时空异质性给模型性能带来负面影响问题方面的有效性,选择了一个公共的人类手势数据集Widar3.0[19, 21]。Widar3.0是一个用于无线信号手势识别的公共数据集,它通过利用信号的多径效应来感知人体运动和手势。日该数据集的采集环境模拟了如图5所示的几个典型室内场景,以确保实验结果能够反映真实环境下的信号变化。由于接收器的位置分别源于教室、办公室和大厅的不同的位置,这确保了每个接收端接收到无线信号的环境语义特征之间的差异。而这种差异则会进一步导致接收器中CSI数据分布之间的不同。

除此之外,发射机配备了一个激活的天线,而每个接收机配备了三个激活的天线,这样的配置可以同时从多个角度接收信号,从而获取更丰富的信号特征。由于接收器的空间位置不同,接收到的无线信号的环境语义特征也各不相同。这是因为信号在传播过程中会受到人体动作、家具布局、墙壁反射等多种因素的影响。接收器位置和人体不同手势的多样性使得 Widar3.0用于验证无线信号在通感一体化中的应用的理想测试平台。

4.2 环境语义特征度量

为了直观感受出无线信号的环境语义特征对接收器中CSI数据分布的影响,基于算法1的设计,将三种不同情况下的接收器接收到的无线信号环境语义特征中各个参数进行估计。

如图5所示,选用了位于大厅位置中的接收器上的数据进行环境语义特征的检测,具体的结果如图6~图8所示。进一步而言,其中包括动态环境语言和静态环境语义特征中的ToF、AoA、DFS,还有幅度四个特征参数。图中的深蓝色点代表了从主要路径,即直接从发射机到接收机的信号路径,或者是反射信号中幅度最强的路径的传输的信号的环境语义特征的估计结果。而浅蓝色点则代表了其余的反射路径和散射路径到达的信号的估计结果。其中ToF主要受信号传播路径影响,包括人体的运动导致信号的反射和折射。对于AoA而言,其主要是与接收器和信号发生器的相对位置有关,同时人体的运动和相对位置也会对其造成影响。而对DFS而言,其主要是受人体的相对运动的影响。最后,对于接收信号的幅度而言,其主要是跟信号发生器的功率,信号的传播路径和人体的相对运动等因素有关,我们估计了一共五条传播路径情况下的环境语义特征的参数,具体结果如图6、图7所示

图6和图7中的(a)-(d)为无线信号的动态环境语义特征参数,(e)-(h)为无线信号的静态环境语义特征参数。通过对比两者可以发现,在接收器编号改变即位置改变但人体手势动作都为“画1”即不改变的情况下,两幅图中展现的动态环境语义特征中的参数的结果非常的相似。但是相比而言,在接收器编号改变,即位置改变的情况下,因为信号的传播路径和周围环境的差异,从而导致两者的静态语义特征中的参数就有着很大的差别。对于其中的环境语义特征参数中的DFS而言,每幅图的静态环境语义特征的DFS均为0,而动态环境语义中则有所波动,这也进一步证实了所提出的算法能有效地捕获接收器中无线信号的环境语义特征。

图8中的(a)-(d)为无线信号的动态环境语义特征参数,(e)-(h)为无线信号的静态环境语义特征参数。通过对比图6和图8可以看出,在接收器编号相同,即位置相同但是人体手势不相同的情况下,两幅图中的静态环境语义特征参数有着一定的相似,但其动态环境语义特征参数却有着很大的差别。前者是因为接收器的相对位置没有发生改变,即信号的静态传播路径没有改变,而后者则是因为人体的手势动作的差别导致接收器接收到的信号的动态环境语义有着很大的差别。

从以上结果可以看出,信号传播的环境以及人体的运动情况的不同都会导致无线信号环境语义特征之间的差别。综合来说,每个接收器接收到的无线信号的静态环境语义特征和动态环境语义特征与各个接收器中CSI信息的数据分布密切相关,而这种环境语义特征的差异也进一步造成了每个接收器中CSI数据分布上的不同。进一步而言,本文通过所提算法将接收器集群进行分组,每个接收器都能在其所对应的无线信号环境语义特征相对差异较小的簇中进行模型训练,以此来减少该数据分布上的差异对模型训练造成的负面影响。

4.3 实验结果

选择用CNN模型来处理widar3.0数据集,具体的原因如下:Widar3.0数据集记录了无线信号在时间序列上的变化,这些变化反映了手势动作的连续性,导致信号强度和相位在短时间内发生变化,而CNN的卷积层通过滑动窗口机制能够有效地捕捉这些时间序列上的局部相关性,从而提取出信号在时间维度上的变化特征。此外,由于数据集中的每个样本包含来自多个天线的信号,这些信号在空间维度上存在差异。CNN能够同时处理这些多维度的特征,捕捉不同天线接收到的信号强度和相位差异,为手势识别提供重要的空间线索。

我们比较了所提算法与FedAvg、FedProx、PACFL等算法分别在如图5场景下布置的12个接收器上的模型性能。FedAvg算法是联邦学习领域中一种基础且广泛应用的算法。其核心思想是通过多轮迭代来训练全局模型。在每轮迭代中,服务器将当前的全局模型分发给各个接收器,每个接收器利用其本地的数据对局部模型进行训练,并计算出本地模型的更新。随后,所有接收器将更新后的局部模型参数发送回服务器,服务器对这些参数进行平均处理,得到新的全局模型,再将该模型分发给各接收器,并开启下一轮迭代。FedProx算法则是主要针对FedAvg在非独立同分布数据场景下收敛性不足的问题。FedProx通过在接收器的优化目标中引入一个正则化项,来限制接收器模型更新的幅度。这个正则化项可以看作是对全局模型的一种“惩罚”,使得接收器的模型更新不会偏离全局模型过远,从而增强了模型的稳定性和收敛性。而PACFL是一种隐私保护的协作联邦学习算法,旨在通过聚类技术提高联邦学习在分布式无线传感网络中的性能,同时保护数据隐私。它通过将客户端(接收器)分为多个簇,每个簇内的客户端具有相似的数据分布,从而提高模型的收敛速度和准确性。

除此之外,参数设置为:局部迭代次数为5,批量大小为16,学习率为0.03,聚类阈值为0.3,每个接收器中的训练集和测试集的样本维度大小均为(500, 2, 1 000, 90)。其中500为样本数量,即每个数据集中包含500个独立的样本。2为实部虚部,每个样本的信号数据包括实部和虚部两个部分,分别表示信号的幅度和相位信息。1 000表述时间长度,每个样本的时间序列长度为1 000个时间单位,用于捕捉信号在时间维度上的变化。90为3天线和30子载波数的乘积,即每个样本在空间维度上有90个特征点。通过120次全局迭代对四种算法进行对比,得到如下的每条曲线和最终的测试精度,具体如图9、表2所示

如图9所示,分别把所提算法与FedAvg、FedProx和PACFL三种算法在widar3.0数据集上的测试精度进行了对比形成了图9中的每条曲线。同时,列出了如表2所示的在120轮时不同算法对应的精度大小。结果表明所提算法测试精度高于其余三者,具体而言,此算法比FedAvg、FedProx和PACFL三者分别高出了5.05%、4.19%和0.15%。可以看出,相比于FedAvg和FedProx两种算法,所提出的算法不仅测试精度更高,且可以更快地达到收敛。与同为聚类方式之一的PACFL算法相比,虽然本文的算法的收敛速度略慢,但其最终的测试精度仍高于PACFL。

接着,对上述几种算法在第120时每个接收器上的测试精度进行了对比分析,具体的结果如图10所示

从图10中可以看出,所提出的算法在应对无线信号的时空异质性给模型训练带来的负面影响的问题是非常有效的。因为每个接收器所处空间环境的不同,所以其接收到的无线信号的环境语义特征之间的差异较大,而这种差异进一步导致了接收器上CSI数据分布之间的不同。以接收器2为例,在FedAvg算法即所有的接收器共用一个全局模型的情况之下,接收器2的测试精度相比于所提算法的测试精度出现了明显的下降。换言之,所提算法将接收器集群进行分组从而将接收器2分组到某一簇中,在该簇中,接收器2接收到的无线信号的环境语义特征与其余接收器接收到的相比,差异会有所减少,从而提高了该接收器的测试精度。但是同时也可以观察到个别的接收器在FedAvg和所提算法下的测试精度较为接近,以接收器9为例,推测其数据分布在整体的数据分布中有一定的代表性,在这种情况下,使用FedAvg算法(即全局统一模型),接收器9的数据分布与全局模型的适配性较好,因此测试精度不会显著降低。值得一提的是,与传统的FedAvg方式相比,本文的算法在单个接收器中最高提升了24.2%。接着,比较了三种不同聚类阈值情况下所提算法下在第120轮时的各接收器精度大小,具体如图11和表3所示

从该图11和表3中可以看出,随着聚类阈值的减小,接收器整体的性能呈现增加的趋势。进一步而言,随着聚类阈值的降低,每个簇中不同接收器数据分布的相似性也就越高,无线信号时空异质性带来的影响也就越低,从而提升了测试精度。实验结果表明,β为0.3情况下的测试精度比β为0.4和0.5两种情况下的测试精度分别高出了2.25%和2.59%。在同一接收器上β为0.3的情况下接收器测试精度最高提升了9.4%。但对于个别接收器而言,聚类阈值的减小反而导致了其测试精度的减小,我们推测尽管该接收器与所属簇中其余接收器接收到的无线信号的数据分布相似程度提高了,但是该接收器所属的簇中的接收器个数减少,导致其训练所需的样本减少,由此导致其测试精度的下降。因此,在选择聚类阈值时,需要在整体性能提升和个别接收器性能之间进行权衡,以找到一个合适的平衡点。

5 结束语

本文提出了一种基于环境语义感知的聚类联邦学习算法,旨在解决无线信号时空异质性给模型精度、收敛速度带来的负面影响。此算法引入了无线信号的环境语义特征的概念,通过分析不同空间位置接收器接收到的无线信号的数据分布相似程度来将接收器进行聚类,以此来应对无线信号的高度时空异质性对模型训练造成的负面影响的问题。在实验部分,使用了Widar3.0数据集进行验证了该算法的优越性并具象化了无线信号的时空异质性的特点。结果表明,所提算法的测试精度分别比FedAvg、FedProx和PACFL分别高出了5.05%、4.19%和0.15%,同一接收器的测试精度最高提升了24.2%。并且随着聚类阈值的减小,每个簇中不同接收器接收到的无线信号的环境语义特征的差异也会减少,导致模型精度最终得到了相应的提升。此结果说明所提出的基于环境语义感知的算法能有效应对无线信号时空异质性给模型性能带来的负面影响。

[1] Dang S, Amin O, Shihada B, et al. What should 6G be?[J]. Nat Electron, 2020,3: 20-29.

[2] Jiang W, Han B, Habibi M A, et al. The Road Towards 6G: A Comprehensive Survey[J]. IEEE Open Journal of the Communications Society, 2021,2: 334-366.

[3] 牛凯,戴金晟,张平. 面向6G的语义通信[J]. 移动通信, 2021,45(4): 85-90.

[4] Giordani M, Polese M, Mezzavilla M, et al. Toward 6G networks: Use cases and technologies[J]. IEEE communications magazine, 2020,58(3): 55-61..

[5] Luo X, Chen H - H, Guo Q. Semantic Communications: Overview, Open Issues, and Future Research Directions[J]. IEEE Wireless Communications, 2022,29(1): 210-219.

[6] Shi G, Xiao Y, Li Y, et al. From Semantic Communication to Semantic - Aware Networking: Model, Architecture, and Open Problems[J]. IEEE Communications Magazine, 2021,59(8): 44 - 50.

[7] 石光明,肖泳,李莹玉,等. 面向万物智联的语义通信网络[J]. 物联网学报, 2021,5(1): 12-36.

[8] Xiao Y, Sun Z, Shi G, et al. Imitation learning-based implicit semantic-aware communication networks: Multi-layer representation and collaborative reasoning[J]. IEEE Journal on Selected Areas in Communications, 2022,41(3): 639-658.

[9] Cui Y, Liu F, Jing X, et al. Integrating Sensing and Communications for Ubiquitous IoT: Applications, Trends, and Challenges[J]. IEEE Network, 2021,35(5): 158 - 167.

[10] 徐金雷,赵俊湦,卢华兵,等. 面向 6G 的多维扩展通感一体化研究综述[J]. 电子与信息学报, 2024,46(5): 1-12.

[11] IMT-2030(6G)推进组. 通信感知一体化技术研究报告[R]. 2021.

[12] Raleigh G G, Cioffi J M. Spatio-temporal coding for wireless communication[J]. IEEE Transactions on Communications, 1998,46(3): 357 - 366.

[13] McInnes L, et al. Umap: Uniform Manifold Approximation and Projection[J]. Journal of Open Source Software, 2018,3(29): 861.

[14] Zheng Y, Zhang Y, Qian K, et al. Zero - effort cross - domain gesture recognition with Wi - Fi[C]//Proceedings of the 17th annual international conference on mobile systems, applications, and services. 2019.

[15] Zhu H, Xiao Y, Li Y, et al. Physical - layer semantic - aware network for zero - shot wireless sensing[C]//2023 IEEE 31st International Conference on Network Protocols (ICNP). IEEE, 2023.

[16] Liu Y, Sun Z, Xiao Y, et al. Clustered Federated Learning for Distributed Wireless Sensing[C].GLOBECOM 2024 - 2024 IEEE Global Communications Conference. IEEE,2024.

[17] Li X, Huang K, Yang W, et al. On the convergence of fedavg on non - iid data[J]. arXiv preprint arXiv:1907.02189, 2019.

[18] Vahidian S, Morafah M, Wang W, et al. Efficient distribution similarity identification in clustered federated learning via principal angles between client data subspaces[C]//Proceedings of the AAAI conference on artificial intelligence. 2023.

[19] Yang Z, Zhang Y, Qian K, et al. {SLNet}: A Spectrogram Learning Neural Network for Deep Wireless Sensing[C]//20th USENIX Symposium on Networked Systems Design and Implementation (NSDI 23). 2023.

[20] Li T, Sahu A K, Zaheer M, et al. Federated optimization in heterogeneous networks[J]. Proceedings of Machine learning and systems, 2020,2: 429-450.

[21] Zhang Y, Zheng Y, Qian K, et al. Widar3. 0: Zero-effort cross-domain gesture recognition with Wi-Fi[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2021,44(11): 8671-8688. ★

沈科同:中国地质大学在读硕士研究生,主要研究方向为机器学习、通感一体化、联邦学习等。

朱慧翔:华中科技大学在读博士研究生,主要研究方向为通感算一体化、边缘智能、网络人工智能等。

陈思怡:中国地质大学在读硕士研究生,主要研究方向为机器学习、聚类联邦学习等。

李莹玉:副教授,现任职于中国地质大学(武汉)机械与电子信息学院,主要研究方向为下一代无线网络技术、机器学习与人工智能、语义通信网络和联邦边缘智能等。

肖泳:华中科技大学教授,IMT-2030(6G)推进组网络智能方向副组长,5G联创行业应用开发实验室副主任,IEEE资深会员,中国通信学会高级会员,IEEE Transactions on Mobile Computing副编辑。主要研究方向为网络人工智能、边缘计算、通信网络博弈理论等。

★往期推荐

【6G卫星互联网】2025年第6期专题论文汇总(19篇)

《移动通信》用论文解读通信

《移动通信》杂志由中国电子科技集团公司主管,中国电子科技集团公司第七研究所主办,是中国期刊方阵“双效期刊”、工业和信息化部精品电子期刊、中国科技论文统计源刊、中国通信学会《信息通信领域高质量科技期刊分级目录》入选期刊、中国电子学会《电子技术、通信技术领域高质量科技期刊分级目录》入选期刊、中国应用型核心期刊、日本JST收录期刊。国内连续出版物号:CN44-1301/TN,国际连续出版物号:ISSN1006-1010,邮发代号:46-181。

来源:移动通信编辑部

相关推荐