一种可扩展和可并行化的数字孪生框架，用于多智能体强化学习系统的可持续的模拟到现实过渡

Mar, 2024

一种可扩展和可并行化的数字孪生框架，用于多智能体强化学习系统的可持续的模拟到现实过渡

A Scalable and Parallelizable Digital Twin Framework for Sustainable Sim2Real Transition of Multi-Agent Reinforcement Learning Systems

PDF

Chinmay Vilas Samak, Tanmay Vilas Samak, Venkat Krovi

TL;DR本文提出了一种可持续的多智能体深度强化学习框架，能够按需选择性地扩展并行训练工作负载，并利用最小的硬件资源将训练策略从模拟转移到真实环境中。我们引入了 AutoDRIVE 生态系统作为一种使合作和竞争的多智能体强化学习策略能够从模拟环境转移到现实环境中进行训练、部署和传输的数字孪生框架。在研究中，我们首先探讨了 4 个合作车辆（Nigel）在单个智能体和多智能体学习环境中共享有限状态信息时的交叉路口问题，并采用了共同的策略方法。然后，我们使用个体策略方法研究了 2 辆车（F1TENTH）的对抗自主赛车问题。在实验中，我们采用了分散式学习架构，能够在不确定性环境中进行稳健的策略训练和测试。智能体只能观察到有限的观测空间，并且只能采样满足运动动力学和安全约束的控制动作。我们以定量指标和定性评述的方式报告了两个问题陈述的实验结果，包括训练和部署阶段。我们还讨论了用于加速多智能体强化学习训练的智能体和环境并行化技术，并分析了它们的计算性能。最后，我们使用提出的数字孪生框架展示了从模拟环境到真实环境中训练策略的资源感知过渡。

Abstract

This work presents a sustainable multi-agent deep reinforcement learning framework capable of selectively scaling parallelized training workloads on-demand, and transferring the trained policies from

multi-agent deep reinforcement learning parallelized training workloads simulation cooperative vehicles adversarial autonomous racing

发现论文，激发创造

基于 AutoDRIVE 生态系统的合作与竞争自主车辆多智能体深度强化学习

该论文介绍了一种用于自主车辆内部具有合作和竞争行为的模块化且可并行化的多智能体深度强化学习框架。通过使用 AutoDRIVE 生态系统来培养和部署多智能体强化学习策略，并利用具有独特特性和能力的两个缩小比例的自主车辆平台 Nigel 和 F1TENTH 来开发具有物理准确性和图形逼真性的数字孪生模型。

Sep, 2023

一种平台不可知的深度强化学习框架，用于自动驾驶中的有效 Sim2Real 迁移

该论文提出了一种强大的 DRL 框架，该框架利用特定于平台的感知模块来提取任务相关信息，并在模拟中训练车道跟踪和超车代理程序，从而促进了 DRL 代理程序对于新的模拟环境和真实世界的无缝转移并极大地缩小了不同平台之间的差距和模拟与现实之间的鸿沟，从而使训练代理程序在模拟和真实世界中能够高效地驾驶车辆。

Apr, 2023

通过数字孪生实现增强式强化学习资源管理：机遇、应用和挑战

提出了一种基于数字孪生增强的强化学习框架，旨在优化网络资源管理的性能和可靠性，此框架在物理网络中应用传统的强化学习面临多个统一挑战，包括有限的探索效率、收敛速度缓慢、长期性能较差以及在探索阶段的安全问题。

Jun, 2024

从多智能体到多机器人：一款可扩展的多机器人强化学习训练和评估平台

本文介绍了一个用于多机器人强化学习的可扩展仿真平台 SMART，该平台包含了一个仿真环境和一个真实的多机器人系统，以提供多样化的交互场景进行训练，并支持基于插件的算法实现。在此基础上，我们研究了合作驾驶变道场景所涉及到的若干具有挑战性的问题，并开源我们的仿真环境及其相关基准测试任务和最先进的基线模型，以推动和强化多机器人强化学习的研究。

Jun, 2022

自动驾驶中的模拟现实和数字孪生：综述

本文探讨了自动驾驶技术中的安全性和成本问题，并介绍了通过两种技术解决虚拟仿真与实际场景差异带来的问题的研究进展：从仿真到真实场景的知识迁移（sim2real）和数字孪生的学习。同时，对算法、模型、仿真器的最新发展进行了概述，阐述了 sim2real 和数字孪生对自动驾驶领域的深远影响。

May, 2023

数字孪生增强深度强化学习用于网络切片资源管理

网络切片通信系统通过动态和高效地分配资源来满足各种服务的需求。本文提出了一种由数字孪生和强化学习代理构成的框架来处理资源分配的问题，并验证了该框架的可扩展性，展示了数字孪生对切片优化策略性能的显著改进。

Nov, 2023

数字孪生的保守和风险意识离线多智能体强化学习

提出了一种适用于基于数字孪生的无线网络的离线多智能体保守分位回归 (MA-CQR) 方案，通过集成分布式强化学习和保守 Q 学习来解决环境的内在的随机性不确定性和数据有限性导致的认识不确定性。在无人机网络中应用该方案，展示了其对轨迹规划问题的优势。

Feb, 2024

基于视觉的 DRL 自主驾驶代理与 Sim2Real 迁移

该研究提出了一种基于视觉的深度强化学习车辆控制方法，能够同时执行车道保持和跟车操作，具有从虚拟环境到真实环境的迁移能力，为自主驾驶技术的研究提供了新思路和方法。

May, 2023

用于自主驾驶的联邦迁移强化学习

使用联邦学习的方法，将基于模拟器的强化学习模型实现动态的知识提取和共享，促进自动驾驶和机器人应用中的知识共享，进而在实时碰撞避免任务中实现更好的表现。

Oct, 2019

在油气工业中增强可靠性和适应性的数字孪生框架，实现最优和自治决策

该研究提出了一个数字孪生框架，应用于石油和天然气工业中的气举过程，旨在提高数字孪生系统的稳健性和适应性。该框架结合了贝叶斯推断、蒙特卡罗模拟、迁移学习和不确定性管理等技术，为数字孪生系统提供高效、可靠、值得信赖的识别，并致力于改进复杂实际场景中的决策过程。

Nov, 2023