Jul, 2020

通过动作空间对抗训练强化学习智能体的鲁棒性提升

TL;DR研究了机器学习在具备恶意状态 / 执行机构攻击下的表现,介绍了深度强化学习在决策和控制任务中存在漏洞的问题,提出了通过对抗训练来提高深度强化学习代理的抗干扰性以实现系统的稳定性和鲁棒性。