Controlgym：用于基准化强化学习算法的大规模安全关键控制环境

Nov, 2023

Controlgym：用于基准化强化学习算法的大规模安全关键控制环境

Controlgym: Large-Scale Safety-Critical Control Environments for Benchmarking Reinforcement Learning Algorithms

Xiangyuan Zhang, Weichao Mao, Saviz Mowlavi, Mouhacine Benosman, Tamer Başar

TL;DR我们介绍了 controlgym，这是一个包含 36 个安全关键的工业控制设置和 10 个基于无穷维偏微分方程的控制问题的库。我们将 controlgym 集成在 OpenAI Gym/Gymnasium (Gym) 框架中，允许直接应用标准的强化学习算法，如 stable-baselines3。此项目旨在为学习动态和控制（L4DC）社区提供服务，探索关键问题：学习控制策略的强化学习算法的收敛性；基于学习的控制器的稳定性和鲁棒性问题；以及强化学习算法在高维度和潜在无穷维度系统上的可扩展性。我们在 https URL 上开源了 controlgym 项目。

Abstract

We introduce controlgym, a library of thirty-six safety-critical industrial control settings, and ten infinite-dimensional partial differential equation (PDE)-based control problems. Integrated within the OpenAI Gym/Gymnasium (Gym) framework, →

controlgym safety-critical industrial control settings infinite-dimensional partial differential equation-based control problems reinforcement learning algorithms scalability of rl algorithms

发现论文，激发创造

safe-control-gym：机器人安全学习控制和强化学习一个统一的基准测试套件

提出了一个名为 safe-control-gym 的新开源基准套件，支持模型和数据驱动控制技术，在 3 个动态系统和 2 个控制任务上提供实现，并建议将 OpenAI 的 Gym API 扩展为支持符号动态和限制条件的查询，并演示如何使用 safe-control-gym 来量化比较传统控制、基于学习的控制和强化学习的多种方法的控制性能、数据效率和安全性。

Sep, 2021

PDE 控制竞技场：基于数据驱动的偏微分方程边界控制基准

基于学习的偏微分方程（PDE）控制的学习环境和强化学习算法，通过引入三个基础性的 PDE 问题，降低了数据驱动控制领域中学习 PDE 控制的门槛，并在稳定性方面取得了进展，虽然代价较高。

May, 2024

安全体育场：统一的安全强化学习基准

这篇论文介绍了一个名为 Safety-Gymnasium 的环境套件和一个名为 Safe Policy Optimization 的算法库，其中包含了 16 种最先进的安全强化学习算法，旨在促进安全性能的评估和比较，并推动强化学习在更安全、更可靠和负责任的实际应用中的发展。

Oct, 2023

EduGym：强化学习教育环境套件

通过 EduGym 这一套教育性的强化学习环境和配套的交互式笔记本，该研究旨在帮助学生更好地理解强化学习的概念和实践，通过提供特定挑战方面的环境和解决方案，从而提高教学效果。

Nov, 2023

SDGym: 使用系统动力学模型的低代码强化学习环境

通过引入系统动态方法（SD）作为一种补充方法，利用 SDGym 生成基于 SD 模拟模型的定制强化学习（RL）环境，验证了通过预先存在的 SD 模型和少量的配置代码可以生成良好指定、丰富的 RL 环境。

Oct, 2023

学会飞行 -- 一种使用 PyBullet 物理引擎的 Gym 环境，用于多智能体四轴飞行器控制的强化学习

本文介绍了一种基于 Bullet 物理引擎的开源多旋翼 OpenAI Gym 环境，并通过多个实验展示了其在控制和强化学习方面的应用，旨在鼓励将控制理论和机器学习相结合的未来研究。

Mar, 2021

PDDLGym：来自 PDDL 问题的 Gym 环境

PDDLGym 是一个从 PDDL 域和问题中自动构建 OpenAI Gym 环境的框架，它是一个特别适合于关系强化学习和关系序列决策研究的框架，也可用作快速构建众多、多样化基准测试的通用框架。

Feb, 2020

ChemGymRL: 数字化学强化学习的交互式框架

该研究提供了一个基于 Open AI Gym 模板的高度可定制和开源的 RL 环境，ChemGymRL，以支持在化学发现中训练 RL 代理，通过使用一系列互连的虚拟化学试验台。研究介绍了这些试验台，并在其中训练了一组标准 RL 算法，最后提供了多个标准 RL 方法的性能讨论和比较以及未来工作的发展方向列表作为 ChemGymRL 的远景。

May, 2023

基于函数值动作空间的强化学习用于偏微分方程控制

本文提出了一种在深度确定性策略梯度算法中使用动作描述符的方法，可以更有效地控制高维连续动作偏微分方程。实验证明该方法比传统方法更高效。

Jun, 2018

深度强化学习在连续控制中的基准测试

研究人员结合深度学习和强化学习在连续控制领域缺失常用基准问题下设计并发布了一套基准问题和参考实现，经过系统评估发现一系列新的结果。

Apr, 2016