Jun, 2023

高效对抗引导的强化学习鲁棒性优化

TL;DR本研究引入了群体对抗训练方法以增强强化学习代理的鲁棒性和优化性能,通过在最优解决方案的近似嵌套和更加普适性的选取方式进行了验证。