AAAINov, 2022

强化学习中的目标:解决 Stackelberg 安全博弈

TL;DR本篇综述关注强化学习在 Stackelberg 安全博弈中的建模,重点在于探讨强化学习算法中目标表示的可能改进和代理控制目标的能力评估,这种方法已经成功应用于类似非法走私、偷猎、森林砍伐、气候变化、机场安全等现实世界场景。