利用深度强化学习及自我对弈的方式优化存在不完美信息的复杂真实移动网络的仿真和实际模拟

NIPSFeb, 2018

利用深度强化学习及自我对弈的方式优化存在不完美信息的复杂真实移动网络的仿真和实际模拟

Sim-to-Real Optimization of Complex Real World Mobile Network with Imperfect Information via Deep Reinforcement Learning from Self-play

PDF

Yongxi Tan, Jin Yang, Xin Chen, Qitao Song, Yunjun Chen...

TL;DR该研究提出了一个基于深度强化学习和图卷积神经网络的跨界面学习框架，该框架在移动网络领域进行了 6 个场地试验，成功的将学习从模拟器中转移到了具有复杂实时限制和有限信息的实际应用场景中。

Abstract

mobile network that millions of people use every day is one of the most complex systems in the world. Optimization of mobile network to meet exploding customer demand and reduce capital/operation expenditures pos

mobile network deep reinforcement learning sim-to-real framework graph convolutional neural network multi-agent system

发现论文，激发创造

基于深度强化学习的实际驾驶环境离散控制

本篇研究提出了一个基于真实驾驶环境的 MDP 框架，使用多智能体学习算法来实现对自动驾驶车辆的训练，并提出了可靠的初始化、数据增强和训练技术来实现最小化的视频数据和培训，最终在 TORCS 虚拟驾驶环境中得到了验证。

Nov, 2022

深度强化学习智能体的实景迁移用于在线覆盖路径规划

通过在仿真环境中训练模型，并在高推理频率下部署，我们成功地将最先进的结果从仿真转移到了真实领域，而直接学习则需要花费几个星期的人工交互，即完全不可行。

Jun, 2024

机器人深度强化学习中的模拟到真实转移：一项调查

本篇综述涵盖了深度强化学习中模拟转真实环境的基本背景，包括不同方向的方法和应用场景，重点讨论了域随机化、域自适应、模仿学习、元学习和知识蒸馏等方法及其存在的机遇和挑战。

Sep, 2020

一种平台不可知的深度强化学习框架，用于自动驾驶中的有效 Sim2Real 迁移

该论文提出了一种强大的 DRL 框架，该框架利用特定于平台的感知模块来提取任务相关信息，并在模拟中训练车道跟踪和超车代理程序，从而促进了 DRL 代理程序对于新的模拟环境和真实世界的无缝转移并极大地缩小了不同平台之间的差距和模拟与现实之间的鸿沟，从而使训练代理程序在模拟和真实世界中能够高效地驾驶车辆。

Apr, 2023

面向移动机器人的深度强化学习认知探索

本文提出了一种使用深度强化学习方法，利用 RGB-D 传感器在室内环境中探索移动机器人的方法，通过对特征表示的感受野进行分析，深度强化学习促进了卷积网络估计场景的遍历性，实验结果表明，采用该方法训练的机器人控制器在真实环境中的认知能力显著提高。

Oct, 2016

深度强化学习在预算内的应用: 3D 控制和推理无需超级计算机

本文介绍了使用简化的三维环境 (ViZDoom) 训练智能体进行复杂推理和探索的基准方案，以提高 Deep-RL 领域的可访问性和减少对大量计算资源的需求。

Apr, 2019

深度强化学习遇见图神经网络：探索一种路由优化用例

本篇论文提出在 Deep Reinforcement Learning 技术中，将 Graph Neural Networks 集成进 DRL 代理中，以解决网络拓扑的泛化问题，并在路由优化的用例中测试并评估其性能，结果表明，在未曾训练过的网络拓扑中，DRL+GNN 代理能够胜过目前最先进的解决方案。

Oct, 2019

无线蜂窝网络上的语义感知协作深度强化学习

提出了一种新的语义感知 CDRL 方法，通过一种新的异构联合 DRL 算法实现了多智能体在无线网络中高效协作，并优化了训练损失和无线带宽分配以满足实时任务的时间限制。与现有算法相比，该方法表现出更优异的性能。

Nov, 2021

AI-Enabled 无线网络的单智能体和多智能体深度强化学习：教程

本文论述了强化学习在 AI 驱动的 6G 网络中的作用，特别是目前热门的多智能体深度强化学习方法，以及其在移动边缘计算、无人机网络和大规模无线接入等方面的最新研究进展与应用前景。

Nov, 2020

网络随机化：增强学习中通用的简单技术

本文提出一种简单有效的技术，通过引入随机卷积神经网络打乱输入观测数据，在提高深度强化学习智能体的泛化能力方面取得了显著效果，并且通过 Monte Carlo 近似的推理方法来减少随机化引起的方差。我们在 2D CoinRun、3D DeepMind Lab 探索和 3D 机器人控制任务中展示了我们的方法的优越性，相比于其他正则化和数据增强方法明显更加优秀。

Oct, 2019