基于内生智能的6G网络形态自演进机制研究

摘要：随着对超高速率、超低时延、超可靠连接需求的增长，6G网络需通过形态自演进机制满足动态环境需求。借鉴了生物种群进化思想，提出了一种基于内生智能的6G网络形态自演进机制，考虑“形态演进”范式，通过模拟生物演进中自然选择与遗传变异过程，使网络能对不同网络需求和应用场

基于内生智能的6G网络形态自演进机制研究

（北京邮电大学，北京 100876）

【摘要】随着对超高速率、超低时延、超可靠连接需求的增长，6G网络需通过形态自演进机制满足动态环境需求。借鉴了生物种群进化思想，提出了一种基于内生智能的6G网络形态自演进机制，考虑“形态演进”范式，通过模拟生物演进中自然选择与遗传变异过程，使网络能对不同网络需求和应用场景快速、精准地作出响应。通过仿真实验，验证了6G网络形态自演进在动态环境下的有效性。结果表明，该机制能够提高网络适应性，为6G网络形态设计提供了理论支持。

【关键词】6G网络；内生智能；形态演进；强化学习

doi:10.3969/j.issn.1006-1010.20241125-0002

中图分类号：TN929.5 文献标志码：A

文章编号：1006-1010(2025)01-0114-08

引用格式：李有卉,王铁儒,张春红,等. 基于内生智能的6G网络形态自演进机制研究[J]. 移动通信, 2025,49(1): 114-121.

LI Youhui, WANG Tieru, ZHANG Chunhong, et al. Self-Evolution Mechanism of 6G Network Architecture Based on Endogenous Intelligence[J]. Mobile Communications, 2025,49(1): 114-121.

随着科技的飞速发展和人们对更高速率、更低延迟、更可靠连接的需求不断增长，现有网络架构有待进一步革新[1]。为了满足未来通信和连接的需求，研究人员开始着眼于下一代移动通信网络——6G网络。6G网络将通过提供超高速率、超低时延、超大连接的通信能力，支撑全息交互、沉浸式体验、智能物联网、车联网及空天地一体化等应用场景的发展，追求更广的覆盖、更高的速率、更多的连接、超低时延、超高定位精度、通信与感知的一体化、更高的智能化、更强的安全性等[2-3]在6G时代，人工智能（AI）将被广泛应用，为6G赋予更高水平的智能化能力[4]，内生智能网络架构将实现人工智能能力与未来6G网络的深度融合[5]。然而，目前人工智能如何为6G网络架构带来实质性益处仍是一个尚未明确的问题。对于移动通信系统中核心网络架构的演变路径，先前工作将这些演变过程归纳为四种基本形式：新增组件的引入[6]、功能模块的淘汰[7]、网络组件间的分离或整合[8]，以及组件交互方式的变化[9]，并将这四种演变形式定义为“网络形态演进（Network Morphology Evolution）”[10]模式。

文献[10]借鉴生物进化的理念，用“自演进（Self-evolution）”来描述6G核心网络在运行中通过自我调整和优化结构以应对环境变化的智能能力，提出了一种专为6G核心网络设计的“自演进智能体（Self-evolving Agent）”。该智能体基于强化学习理论，能够通过获取环境反馈奖励来主动调整核心网络架构，以适应多变的环境条件。然而，这是从生物体个体的视角出发，探讨生物体在进化过程中通过改变细胞、组织和整体结构的三级层次组成来适应环境的动态变化。该视角的核心聚焦于单个生物体的适应和演进。这个过程将网络演进划分为基因生成、组合和评估三个阶段，分别通过手动或自动生成微服务、将微服务组合为网络功能并构建静态拓扑、以及基于环境信息评估网络配置性能。该方法强调逐步优化的分阶段策略。

与此不同，本文将从更宏观的生物种群进化视角出发，将智能体作为种群中的个体，关注种群在动态环境中的演进过程。通过自然选择和基因突变等机制，种群个体间的多样性决定了最终网络形态的自演进。多样性保证了种群在动态环境中可以持续探索不同的网络形态，而自然选择则通过筛选适应度高的个体，使种群逐渐进化出最适应环境需求的网络形态。相较于文献[10]以局部组合和逐步评估为核心的策略，本文的方法更注重全局性的优化。从种群视角出发，能够更全面地研究种群在代际演进中的动态变化，为6G网络形态自演进机制提供新的理论支持与启示。

基于上述讨论，本文提出了借鉴生物种群进化思想的6G网络形态自演进机制，通过模拟自然选择和遗传变异过程，使网络能根据环境需求调整网络拓扑形态。本文首先介绍内生智能相关背景，讨论形态演进领域的相关工作，总结6G网络形态自演进可借鉴之处；接着，提出基于内生智能的6G网络形态自演进机制，使得6G网络能够对不同的网络需求和应用场景快速、精准地作出响应；最后，通过进行仿真实验，验证提出的6G网络形态自演进机制的有效性，进行6G网络形态自演进案例分析。

1.1 基于内生智能的6G网络架构

在5G网络中，人工智能技术已应用于网络切片资源管理[11]、网络安全防护[12]等领域，提升了5G网络的智能化水平。然而，这些工作通常采用插件式的方法，AI模型的应用缺乏有效的验证机制和质量保证措施，模型训练与推理过程相互独立，效果验证只能在事后进行，难以支持高水平的网络自治[5]。而内生智能网络架构使人工智能能力能够与未来的6G网络深度融合，赋予网络智能能力，从而将6G网络服务提升到一个新的境界。移动通信网络架构的演进总结为形态演进和参数演进两种范式。与前文讨论的从宏观层面分析的“网络形态演进”相比，网络的演进还包括一种以最优化问题形式呈现的微观层面演进方式[13-15]。例如，在无线网络资源分配、边缘计算调度等性能优化的研究中，大多以既定的网络架构、通信协议和运行机制作为算法的实验假设，仅关注局部或微观层面的性能优化。这类优化通常将网络体系架构视为不可更改的黑盒，将其作为独立部分进行自我优化。由于这种优化方式依赖于机器学习算法，可被抽象为一组可学习和可求解的模型参数，因此这种演进方式被称为“网络参数演进”。目前，大多数研究工作集中于“参数演进”范式，对“形态演进”范式的探索则相对较少。基于内生智能的6G网络形态自演进的研究思路，可借鉴生物演进的思想[10]。将6G网络视为一个有机生物主体（Agent），将网络架构形态（Morphology）视为生物体形态。生物种群中的各个个体通过与外部自然环境的不断交互，观察获取环境变量，经由大脑做出分析判断，选择有利于自身生存竞争的最佳行为，从环境中争取更多的奖励反馈，在当前环境中表现出更高的适应度，从而影响演进的方向。在这个过程中，为了能够获取更多奖励，生物个体主动选择自身的行为，争取让当前的形态适应环境的不断变化。

1.2 形态演进

6G网络形态自演进是本文提出的重要思想和关键研究问题。在机器学习领域，文献[10]引入了一个包含机制、架构、智能体和算法的综合框架，使网络能够自主生成和优化自身结构，从而确保对广泛应用场景的适应性。文献[16]基于5G核心网络已采用的SBA（Service-based Architecture，服务化架构），提出了一种6G核心网络智能的自演进机制，自动生成分布式核心网络。除此之外，几乎还没有工作针对通信网络开展的形态演进研究。

不过，在模拟生物肢体形态演进方面，已经出现不少学术论文，其展现的思想，可尝试借鉴到通信网络的应用场景中，对网络形态演进的研究工作提供启发。文献[17]提出了一种基于部件装配的设计空间约束方法，并通过贝叶斯优化在连续特征空间中探索设计。文献[18]结合深度强化学习和进化算法，在物理模拟环境中优化智能体的形态和控制策略。文献[19]提出了一种拉马克式协同设计方法，结合深度强化学习优化控制器并利用迁移学习实现软体机器人控制器跨代继承。文献[20]提出了一种基于图语法的通用机器人设计表示方法，结合图启发式搜索实现了高效的设计探索与优化。文献[21]提出了一种全自动的方法生成优化的机器人结构以穿越给定的地形。文献[22-23]将机器人的协同设计被表述为一个图搜索问题，文献[24]、文献[25]采用分开的参数分别来生成机器人的形态和控制，两者在双层框架中进行优化。文献[26]设计了一种基于课程学习的机器人脑-体联合演进方法。文献[27]将智能体的生物形态设计过程加入决策过程，将机器人自动设计定义为通过强化学习算法学习一种条件策略。文献[28]提出了一种基于数据驱动的智能体形态与行为共同演进算法，充分利用先验信息做出更明智的决策。

以上模拟生物肢体形态演进的相关工作为6G网络结构搭建和自演进提供了可借鉴思路。现有的模拟生物形态智能体演进实验表明，算法可以一定程度上发现符合现有生物学基础和适应当前环境的智能体，使得6G网络可以进行形态自演进，使演进后的网络形态比上一代网络具有更强的环境适应性。

2 6G网络形态自演进机制

2.1 6G网络形态自演进思想

基于5G核心网络的SBA，假设6G核心网络功能可以进一步拆分为基本网络功能，这些基本网络功能可以抽象为微服务[29]。通过对微服务的重新组合和部署，生成网络功能，以实现各种复杂功能。本文将微服务定义为6G网络形态自演进的最小单元，有y个微服务组成的集合即为6G网络形态自演进基因库GenePool={g1(1≤i≤y)表示第i个微服务。

具体来说，6G网络中的微服务相当于生物体的基因，是最基本的功能单元，通过组合形成网络功能，这些网络功能对应生物体的肢体，多个网络功能协同工作，为网络提供特定的能力。最终，这些网络功能承担不同的功能需求，并共同构成整个6G自演进网络，6G自演进网络的形态相当于生物体的整体形态。例如，对于鱼类来说，不同的基因组合形成了鱼鳍、鱼尾等具有不同能力的肢体，这些肢体组合成了鱼的形态，并且通过协作，使得这条鱼获得在水中游的能力。当自然环境发生变化时，比如水体变浅或完全干涸，鱼可能需要通过爬行或短距离移动找到新的水源。这种环境压力可能促进某些鱼类逐渐演化出类似腿的结构。同时，自然界中随机的基因突变可能导致鱼鳍的形态发生变化。在特定环境中，这种变化可能增加生存概率，从而被自然选择保留并传递下去。

类似于生物适应环境，随着通信环境在空间或时间上的变化，6G网络形态自演进智能体通过对当前场景的网络需求快速、精准地作出响应，从环境中争取更多的奖励反馈，表现出更高的适应度，从而在自然选择中存活下来，在此基础上进行基因突变，有利于朝着更适应环境的方向演进。

在空间维度与时间维度上，6G网络形态自演进机制分别表现出特化与进化的演进特点。网络的特化指在同一时间横截面内，网络为满足不同用户的个性化需求，由一般化向特殊化发展的演进趋势。而在长时间跨度中，随着用户需求不断变化，网络持续迭代更新，从而又表现出在时间维度上与生物类似的进化特点。

2.2 6G网络形态自演进建模

生物肢体形态演进为6G网络形态搭建和演进提供了可借鉴思路。如图1所示，将一个6G网络形态进行仿生设计。6G网络形态自演进基因库GenePool中的微服务首先组合形成网络功能，一个网络功能相当于生物的一个肢体，k个网络功能相互协作，形成一个6G自演进网络。将6G自演进网络视为一个智能体，其形态考虑采用图结构（Graph Structure）进行建模，以精确描述6G自演进网络的拓扑结构及其动态演进过程。具体步骤如下：

Step1：构建基于图的6G自演进网络形态结构。记整个6G自演进网络形态为一个无向图G=(V, E)，其中V表示节点集，E表示边集。节点集V中包含n个节点。每个节点vi∈V对应一个网络功能，而每条边eij∈E表示两个节点之间的通信链路。eij={0, 1}分别表示节点之间是否能够直接通信。Step2：完善节点与边的属性。节点vi=(id, Gene, C, B)，其中id={1, 2, ...}表示节点的序号，Gene={g12, ...}表示部署在这个节点上的微服务集合，C代表节点计算能力，B代表节点带宽。

3 仿真验证

3.1 仿真场景

考虑一个6G通信场景，其中包含的网络节点集合为V，可调用的微服务集合为GenePool。在该场景中，用户会在网络节点覆盖区域内频繁提交类型多样的请求。场景中的网络节点需要处理用户提交的请求，使得产生的通信延迟尽可能低、资源开销尽可能小。

3.2 仿真设置

本文基于开源的Python工具包OpenAI Gym[30]搭建了一套简易的仿真环境。OpenAI Gym专为强化学习任务提供标准化环境，使用户能够轻松设计和定制新的环境，还支持在训练过程中实时监控环境状态和奖励。环境中的状态空间、动作空间和奖励函数的定义与前文一致。为在仿真场景中模拟用户流量，使用一个任务生成模型来产生任务，假设任务的生成过程遵循泊松分布[31]，其中泊松分布的参数λtask，表示在一个时间步内会生成的平均任务数量。任务生成模型生成任务的大小为tasksize，类型为tasktype。由于本仿真目的是验证6G网络形态自演进机制的可行性，所以对微服务做了简化，基于文献[16]，考虑服务拆分后的5个微服务分别为MSABCD、MSE。这5个微服务的集合即为6G网络形态自演进基因库GenePool。任务生成模型会产生任务类型1、2、3、4、5。这5种任务需要不同的微服务组合才能处理，任务类型与所需微服务组合的对应关系如表1所示。当任务类型对应的微服务集合是网络节点上部署的微服务集合的子集时，才认为该网络节点具有处理该种任务的能力。

在奖励函数中，Delay(s, at)包括智能体在当前时间步处理任务产生的计算延迟tcom和传输任务数据的通信延迟ttr，即Delay(st, at)=tcom+ttr。Consumption(st, at)包括智能体在当前时间步处理任务产生的计算开销ccom和传输任务数据的通信开销ctr，即Consumption(stt)=ccom+ctr。为简化建模，简单定义如下：tcom=tasktype/C，ttr=tasksize/B，ccom=ε×tcom，ctr=ξ×ttr主要仿真参数如表2所示。其中，n限制智能体的节点数量处于[2, 5]区间内，以此规避节点数量过少或过多所引发的问题。节点数量过少可能致使智能体在处理任务时面临过高压力，而节点数量过多则可能造成不必要的资源损耗。C与B的取值范围分别都被限定在[500, 1 000]之间，从而确保智能体于初始化阶段或执行M2突变时，各节点的计算能力与带宽取值均处于该预设范围之内。此外，tasksize将任务生成模型所生成任务的规模限制于[100, 300]范围之中。

3.3 仿真结果及分析

由于仿真目的是验证提出的6G网络形态自演进机制的有效性，所以将使用6G-MEA的6G网络与不受进化影响的一般6G网络（Naive）进行性能对比。仿真结果如下。由于每次初始化种群时，个体的形态是随机初始化的，所以在第0代的时候，下文各图中曲线对应的奖励值、平均通信延迟和平均资源开销，对于算法性能的分析不具参考价值。

图3展示了6G-MEA与Naive方法的奖励值曲线。6G-MEA在约第50代时，奖励值显著上升，随后逐渐趋于稳定，并最终在第100代时达到约400的奖励值，且波动较小，表现出良好的收敛性。相比之下，Naive方法的奖励值几乎保持不变，这表明6G-MEA能够有效优化智能体的策略。

图4展示了6G-MEA在不同任务数量条件下的奖励值曲线，图中各条曲线分别为λtask等于10、15、20、25、30时种群的奖励值。实验结果显示，在λtask逐步增大的过程中，6G-MEA的奖励值曲线在收敛之后的值呈现出逐渐下降的趋势。这一现象的产生可能是因为任务数量的增加导致系统不确定性增强，大量任务的存在提升了智能体决策的复杂程度。在高任务量所构建的复杂环境下，智能体学习最优策略的难度加大，容易导致错误决策或者次优决策的出现，进而对奖励产生负面影响。然而，各条奖励值曲线整体依旧呈上升趋势，这一情况说明6G-MEA仍具备适应不同复杂程度环境的能力。当λtask分别为15、20和25时，奖励值曲线在约第50代后波动较小。智能体可能在学习过程中陷入了局部最优策略。这意味着尽管它没有达到全局最优的奖励，但在当前的策略空间内难以进一步改进，导致奖励值趋于稳定。此外，可能是因为任务数量的增加使环境中的计算资源或通信资源趋于饱和，限制了智能体对资源使用策略的优化空间，进而降低了奖励值的变化幅度。这一现象表明仿真环境的设计仍有进一步优化的潜力，以便更准确地评估算法在复杂环境中的表现。

图5和图6分别展示了6G-MEA与Naive在降低通信延迟和资源开销方面的表现。图中的通信延迟和资源开销分别是种群完成内层循环后，种群中所有个体的平均通信延迟和平均资源开销。6G-MEA在约第40代以后表现出显著的优势，通信延迟和资源开销均显著低于Naive方法，而Naive方法在整个过程中始终维持较高的通信延迟和资源开销水平。此外，在约第70至第80代之间，6G-MEA出现通信延迟和资源开销短暂增高的现象，这可能是由于算法随机突变引发的网络形态结构变化，导致其在短期内朝着不利于适应环境的方向演进，从而无法快速、精准地响应环境变化。

表3展示了不同方法在通信延迟下降率和资源开销下降率方面的表现。其中，SEA-Satellite与SEA-Emergency是文献[10]所提方法于卫星通信及应急通信场景下的具体应用。

由表3可知，6G-MEA表现最为优异，在优化通信延迟并降低资源开销方面彰显出显著的优势。SEA-Satellite与SEA-Emergency方法虽在通信延迟优化及资源开销降低方面有所提升，然而相较于6G-MEA仍存在一定差距。相较而言，Naive方法成效欠佳，在通信延迟优化与资源开销降低方面作用较为有限。由此可见，自演进智能体能够较好地适应复杂多变的环境条件。从更为宏观的生物种群进化视角所构建的6G网络形态自演进机制，相较于从生物体个体视角出发的SEA方法，在通信延迟降低以及资源开销减少层面展现出更强的优越性。种群视角能够引入更为丰富的网络形态多样性，从而有效适应多变的环境，而个体视角可能因多样性匮乏致使在复杂环境中的适应性相对薄弱。

综上所述，6G网络形态自演进机制彰显出优越性，6G-MEA在降低通信延迟以及减少资源开销方面展现出有效性。具体而言，其能够以较快的速率收敛至较高的奖励值水平，并且在复杂任务环境之中维持相对较小的波动幅度，这体现出6G-MEA具备良好的环境适应性。然而，由于随机突变因素的存在，导致其在短期内呈现出一定的性能波动现象，揭示了6G-MEA在仍存在有待改进与优化的空间。但从总体来看，6G-MEA为6G网络形态设计方面提供了有效支持，为后续进一步深入探究6G网络设计奠定了理论基础。

3.4 仿真案例展示

图7展示了网络自演进实验的案例，直观体现了演进过程其中6代种群的进化特征。纵向虚线矩形内的圆形节点代表当前代种群中的各个自演进智能体，节点上的数字标识其编号。图中展示了id分别为10、13、15、16的智能体形态示意图，智能体13和智能体16的母代都是智能体10，它们分别进行了随机突变M1312(Ω)而产生了智能体15。

在演进过程中，6G形态自演进网络智能体通过随机突变调整自身的网络形态，使得进化后的网络结构相比于上一代更适应当前的环境需求。这一案例有效展示了6G网络形态自演进机制在动态环境中的适应能力。

4 结束语

本文研究了一种基于内生智能的6G网络形态自演进机制。借鉴生物种群进化思想，通过引入自然选择与遗传变异的概念，实现了6G网络形态的适应性调整。通过仿真实验，验证了6G网络形态自演进机制的有效性。实验结果表明，该机制能够提升6G网络对复杂应用场景的适应能力，为未来6G网络设计提供了创新性解决方案。此外，本文还提出了进一步优化仿真环境的方向，为下一步研究奠定了基础。

参考文献：（上下滑动浏览）

[1] Wang C X, You X, Gao X, et al. On the road to 6G: Visions, requirements, key technologies, and testbeds[J]. IEEE Communications Surveys & Tutorials, 2023,25(2): 905-974.

[2] Mahmoud H H H, Amer A A, Ismail T. 6G: A comprehensive survey on technologies, applications, challenges, and research problems[J]. Transactions on Emerging Telecommunications Technologies, 2021,32(4): e4233.

[3] Jiang W, Han B, Habibi M A, et al. The road towards 6G: A comprehensive survey[J]. IEEE Open Journal of the Communications Society, 2021,2: 334-366.

[4] Yang H, Alphones A, Xiong Z, et al. Artificial-intelligence-enabled intelligent 6G networks[J]. IEEE network, 2020,34(6): 272-280.

[5] Li L. A survey on intelligence-endogenous network: Architecture and technologies for future 6G[J]. Intelligent and Converged Networks, 2023.

[6] Zhang S. An overview of network slicing for 5G[J]. IEEE Wireless Communications, 2019,26(3): 111-117.

[7] Choi Y J, Lee K B, Bahk S. All-IP 4G Network architecture for efficient mobility and resource management[J]. IEEE wireless communications, 2007,14(2): 42-46.

[8] Song L, Xu Z, Tian Z, et al. Research on 4G and 5G authentication signaling[C]//Journal of Physics: Conference Series. IOP Publishing, 2019,1213(4): 042048.

[9] Lauridsen M, Gimenez L C, Rodriguez I, et al. From LTE to 5G for connected mobility[J]. IEEE Communications Magazine, 2017,55(3): 156-162.

[10] Lu L, Liu C, Zhang C, et al. Architecture for self-evolution of 6g core network based on intelligent decision making[J]. Electronics, 2023,12(15): 3255.

[11] Abiko Y, Saito T, Ikeda D, et al. Flexible resource block allocation to multiple slices for radio access network slicing using deep reinforcement learning[J]. IEEE Access, 2020,8: 68183-68198.

[12] Ravi N, Rani P V, Shalinie S M. Secure deep neural (SeDeN) framework for 5G wireless networks[C]//2019 10th International Conference on computing, communication and networking technologies (ICCCNT). IEEE, 2019: 1-6.

[13] Marasinghe D, Jayaweera N, Rajatheva N, et al. Hierarchical user clustering for mmwave-NOMA systems[C]//2020 2nd 6G Wireless Summit (6G SUMMIT). IEEE, 2020: 1-5.

[14] Huang Q, Kadoch M. 5G resource scheduling for low-latency communication: A reinforcement learning approach[C]//2020 IEEE 92nd Vehicular Technology Conference (VTC2020-Fall). IEEE, 2020: 1-5.

[15] Van Huynh N, Hoang D T, Nguyen D N, et al. Optimal and fast real-time resource slicing with deep dueling neural networks[J]. IEEE Journal on Selected Areas in Communications, 2019,37(6): 1455-1470.

[16] Liu Z, Zhang M, Zhang C, et al. 6G Network Self-Evolution: Generating Core Networks[C]//2023 IEEE International Conference on Communications Workshops (ICC Workshops). IEEE, 2023: 625-630.

[17] Saito T, Oka M. Effective Design and Interpretation in Voxel-Based Soft Robotics: A Part Assembly Approach with Bayesian Optimization[C]//Artificial Life Conference Proceedings 36. One Rogers Street, Cambridge, MA 02142-1209, USA journals-info@ mit. edu: MIT Press, 2024(1): 26.

[18] Wang Z, Benes B, Qureshi A H, et al. Evolution-based Shape and Behavior Co-design of Virtual Agents[J]. IEEE Transactions on Visualization and Computer Graphics, 2024.

[19] Harada K, Iba H. Lamarckian Co-design of Soft Robots via Transfer Learning[C]//Proceedings of the Genetic and Evolutionary Computation Conference. 2024: 832-840.

[20] Zhao A. Robot Graph Grammars: Towards Custom Robots for Every Task[D]. Massachusetts Institute of Technology, 2024.

[21] Zhao A, Xu J, Konaković-Luković M, et al. Robogrammar: graph grammar for terrain-optimized robot design[J]. ACM Transactions on Graphics (TOG), 2020,39(6): 1-16.

[22] Wang T, Zhou Y, Fidler S, et al. Neural graph evolution: Towards efficient automatic robot design[J]. arXiv preprint arXiv:1906.05370, 2019.

[23] Pathak D, Lu C, Darrell T, et al. Learning to control self-assembling morphologies: a study of generalization via modularity[J]. Advances in Neural Information Processing Systems, 2019,32.

[24] Bhatia J, Jackson H, Tian Y, et al. Evolution gym: A large-scale benchmark for evolving soft robots[J]. Advances in Neural Information Processing Systems, 2021,34: 2201-2214.

[25] Belmonte-Baeza Á, Lee J, Valsecchi G, et al. Meta reinforcement learning for optimal design of legged robots[J]. IEEE Robotics and Automation Letters, 2022,7(4): 12134-12141.

[26] Wang Y, Wu S, Fu H, et al. Curriculum-based co-design of morphology and control of voxel-based soft robots[C]//The Eleventh International Conference on Learning Representations. 2023.

[27] Yuan Y, Song Y, Luo Z, et al. Transform2act: Learning a transform-and-control policy for efficient agent design[J]. arXiv preprint arXiv:2110.03659, 2021.

[28] Luck K S, Amor H B, Calandra R. Data-efficient co-adaptation of morphology and behaviour with deep reinforcement learning[C]//Conference on Robot Learning. PMLR, 2020: 854-869.

[29]

[30] Brockman G. OpenAI Gym[J]. arXiv preprint arXiv:1606.01540, 2016.

[31] Huang B, Li Y, Li Z, et al. Security and cost‐aware computation offloading via deep reinforcement learning in mobile edge computing[J]. Wireless Communications and Mobile Computing, 2019(1): 3816237. ★

★原文刊发于《移动通信》2025年第1期★

作者简介李有卉：北京邮电大学在读硕士研究生，研究方向包括强化学习。王铁儒：北京邮电大学在读硕士研究生，研究方向包括强化学习、自然语言处理。张春红：博士毕业于北京邮电大学，2015年于伊利诺伊理工学院担任访问学者，现任北京邮电大学信息与通信工程学院讲师，曾任BigCom国际会议的技术程序委员会（TPC）成员，研究方向包括数据挖掘、推荐系统、自然语言处理和计算机视觉。胡铮：博士毕业于北京邮电大学，现任职于北京邮电大学网络与交换技术国家重点实验室工作，研究方向包括网络空间用户行为建模、分析、认知以及智能应用系统。《移动通信》★往期推荐★

【25专题征稿】6G卫星互联网、语义通信、通感算一体化

《移动通信》杂志由中国电子科技集团公司主管，中国电子科技集团公司第七研究所主办，是中国期刊方阵“双效期刊”、工业和信息化部精品电子期刊、中国科技论文统计源刊、中国通信学会《信息通信领域高质量科技期刊分级目录》入选期刊、中国电子学会《电子技术、通信技术领域高质量科技期刊分级目录》入选期刊、中国应用型核心期刊、日本JST收录期刊。国内连续出版物号：CN44-1301/TN，国际连续出版物号：ISSN1006-1010，邮发代号：46-181。

来源：移动通信编辑部

标签：网络智能体研究智能内生

本文地址：http://news.43b.com.cn/a/1021702.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!