Jun, 2024

对抗性强化学习中的错误最小化的概率视角

TL;DR深度强化学习中对抗性噪声的解决方法,包括使用正则化方法和引入 Adversarial Counterfactual Error 目标来提高鲁棒性。实证结果表明该方法在解决对抗 RL 问题上优于当前最先进的方法。