Jul, 2022

连续控制任务中带不确定性集合正则化的鲁棒强化学习

TL;DR本文提出了一种基于不确定参数空间的不确定性集合正则化器 USR,以提高强化学习在真实世界机器人领域中的鲁棒性和推广性,并在实际测试环境下对其进行评估。