Nov, 2019

深度强化学习的在线稳健性训练

TL;DR通过强化学习中的 Robust Student-DQN 系统可以实现在线强健性训练,使 Q 网络能够在竞争性表现的同时成为强大敌手攻击下的鲁棒代理。该系统可以与最先进的敌对训练和可证明的强健性训练相结合,从而获得一个训练和评估过程中抵御强烈攻击的代理。