Jun, 2022

RORL: 基于保守平滑的强化学习离线稳健性算法

TL;DR本文介绍了一种名为 Robust Offline Reinforcement Learning(RORL) 的保守平滑技术,用于解决当前离线 RL 算法在真实环境中遇到观测扰动时的鲁棒性问题,同时还能在性能和鲁棒性上实现权衡,并取得了非常好的表现。