ICLRJan, 2021

基于学习得到的优化对手的状态观测下鲁棒强化学习

TL;DR研究了强化学习在面对敌对攻击 (即使状态的扰动) 时的鲁棒性,并提出了一种基于 ATLA 框架的方法来增强 Agent 的鲁棒性,通过训练 online 的对抗学习可以达到最优敌对攻击框架与提前学习历史数据等手段,从而提高强化学习在实验中的表现。