- 基于 MADRL 的 360° 视频流媒体自适应与多视点预测
提出了一种多模态时空注意力转换器来生成多个视点轨迹,基于多视点预测的多智能体深度强化学习 (MADRL) 的自适应比特率流媒体算法,用于在不同的网络条件下最大化不同的体验质量 (QoE) 目标,实验结果显示与现有的自适应比特率方法相比,提出 - 通过深度强化学习从自我中心视觉中学习机器人足球
我们运用多智能体深度强化学习(RL)通过自我中心的 RGB 视觉训练端到端的机器人足球策略,解决了现实世界机器人领域中的许多挑战,包括主动感知、灵活的全身控制和长时间跨度的计划等。该论文是首次展示了通过将原始像素观测映射到关节级动作的端到端 - 最佳响应塑造
在部分竞争环境中,我们研究了多智能体深度强化学习的挑战,传统方法难以促进基于互惠合作的行为。为解决现有技术中的局限性,我们提出了一种新的方法 —— 最佳回应塑造(BRS),通过对手的求解最佳回应进行差分学习。利用基于问题回答的方法提取智能体 - 分散式车联网中移动 AIGC 服务的基于学习的激励机制
在本文中,我们提出了一种分散化的激励机制,利用多智能体深度强化学习在车联网环境中平衡 RSUs 上的 AIGC 服务供应和用户对服务的需求,以优化用户体验和减小传输时延。实验结果表明,我们的方法在性能上优于其他基准模型。
- 一种可扩展和可并行化的数字孪生框架,用于多智能体强化学习系统的可持续的模拟到现实过渡
本文提出了一种可持续的多智能体深度强化学习框架,能够按需选择性地扩展并行训练工作负载,并利用最小的硬件资源将训练策略从模拟转移到真实环境中。我们引入了 AutoDRIVE 生态系统作为一种使合作和竞争的多智能体强化学习策略能够从模拟环境转移 - 分布式卫星路由的多主体深度强化学习
该研究介绍了一种用于低地球轨道卫星链路的多智能体深度强化学习方法(MA-DRL),通过融合全局深度神经网络以及本地预训练 DNN,实现离线学习最优路径并快速适应网络和流量变化,在线实现高效分布式路由。
- 多智能体深度强化学习中的联合内在动机
多智能体深度强化学习中,稀疏奖励与智能体之间的协调是挑战,本文提出了一种基于联合行为的奖励策略,并通过 JIM 方法展示了多智能体内在动机在解决需要高协调水平的任务中的重要性。
- 下行低轨卫星网的干扰感知紧急随机接入协议
我们提出了一个多智能体深度强化学习(MADRL)框架,用于训练低轨道卫星网络的下行多用户接入协议。通过改进现有学习的协议 eRACH,我们的方法 Ce2RACH 可以通过在 MADRL 训练过程中联合学习额外的信令消息来减轻卫星之间的干扰。 - 基于集中训练和分散执行的多智能体深度强化学习在交通基础设施管理中的应用
我们提出了一个多智能体深度强化学习框架,用于管理大型交通基础设施系统的全生命周期。该框架通过约束的部分可观测马尔可夫决策过程,解决了在存在不确定性、风险考量和有限资源的情况下,对交通基础设施进行优化管理的问题。通过开发一种名为 DDMAC- - 从面向语言到紧急沟通的知识蒸馏:针对多智能体远程控制
通过使用预训练的大型语言模型,我们比较了基于多智能体深度强化学习 (MADRL) 的紧急通信 (EC) 和以人类语言为基础的语义通信 (LSC),在一个多智能体远程导航任务中,使用多模态输入数据,显示了 EC 在使用多模态数据时产生高成本和 - 基于 MADRL 的无人机轨迹设计及在车联网中的防碰撞机制
在未来的 6G 网络中,无人机作为移动基站将发挥基础作用,特别是在车联网 (V2X) 应用中。本文提出了一种基于排名的二进制掩码方法,以解决多个无人机协作服务同一区域时的碰撞问题,提高训练性能并满足安全约束。
- 金丝雀与哨声:具有或不具有深度强化学习的弹性无人机通信网络
在本研究中,我们考虑了一种具有挑战性的情境,其中无人机在供应链的制造过程中受到了损害,并携带着能够广泛传播和带来破坏的恶意软件。我们通过研究多智能体深度强化学习作为一种学习防御策略、最大化通信带宽的工具,来解决这一问题。通过使用一个公共挑战 - 通过自适应图形的无线网络中的多智能体强化学习功率控制
无线网络中的动态优化策略是一个重要的研究领域,本文提出了一种使用图神经网络的方法,将分布式代理之间的动态相互作用建模,并在网络优化问题中实现了较好的泛化能力验证
- MM鲁棒网络切片:多智能体策略,对抗攻击和防御策略
该论文提出了一个在多个基站和多个用户的动态环境中实现网络切片的多智能体深度强化学习框架。通过模拟评估了所提出的深度强化学习算法的性能,然后设计了一种基于深度强化学习的干扰器,用于最小化网络切片实现的传输速率并降低网络切片代理的性能,最后提出 - 信号路网中交通信号控制和车辆路径的多智能体深度强化学习的联合优化
为了缓解城市交通拥堵问题并提高交通效率,本文提出了一种联合优化方法,使用多智能体深度强化学习(MADRL)来进行交通信号控制和车辆路由的信号化道路网络。通过建立代理之间的联系和共享观察和奖励,促进了代理之间的交互和合作,增强了个体训练。数值 - 通过无人机群体进行大规模物联网中的年龄最小化:一种多智能体增强学习方法
应用多智能体深度强化学习来解决大型物联网场景中的高维问题,通过部署一群无人机 (UAV swarm) 为物联网网络提供覆盖,并最小化信息时效,结果表明合作和部分合作的多智能体深度强化学习方法能够优于复杂度高的集中式深度强化学习方法。
- 基于多智能体深度强化学习的 AI 驱动病人监测
通过使用多智能体深度强化学习 (DRL) 的人工智能驱动的患者监控框架,我们提出了一个有效的患者监测系统,在处理复杂、动态的环境和波动的生命体征方面具有很大优势。我们的实验结果证明了该框架在监测患者生命体征方面的准确性优于传统模型,并通过超 - MM基于多智能体深度强化学习的 IAB 网络联合功率与子信道分配
开发了一个基于多智能体深度强化学习框架的集成接入和回传网络的联合优化方法,该方法通过 SAPA (Subchannel Allocation and Power Allocation) 问题的深度 Q 学习网络和随机方案的基线比较,展示了有 - 利用认知和机器模型在协作多智能体系统中学习
基于平衡学习理论和深度强化学习技术,我们提出了三种多智能体实例基学习(MAIBL)模型,用于协调在随机环境下的多智能体系统。通过在动态环境中展示瞬间学习能力和协调技巧,我们证明 MAIBL 模型相对于现有的多智能体深度强化学习模型更快地学习 - 基于分布式网络的电动车充电控制的联邦强化学习
电动车充电控制中的多智能体深度强化学习方法结合了多电动车充电与放电过程以及射线分布网络的优化功率流,通过联邦式深度强化学习算法来有效地学习最佳的充电控制策略,从而平衡车辆与电网之间的利益和减少驾驶员的焦虑情绪。