May, 2022

关于在观测扰动下安全强化学习的鲁棒性

TL;DR本文研究了安全强化学习中观测对抗攻击的安全性和鲁棒性,并提出了两种新方法以最大化代价或奖励来攻击目标,同时提出了一种鲁棒性训练框架。