Apr, 2023

基于行为约束的机器人控制 Actor-Critic 深度强化学习算法基准测试

TL;DR本研究提出了一种用于评估行动受限强化学习算法的基准测试,对现有算法及其新颖变种在多个机器人控制环境下进行评估,提供了领域的第一个深入视角,并揭示了令人惊讶的见解,包括普通基准方法的有效性。我们的实验中使用的基准问题和相关代码可在 github.com/omron-sinicx/action-constrained-RL-benchmark 上获得以供进一步研究和发展。