Nov, 2023

有界理性曲线下的鲁棒对抗强化学习

TL;DR基于熵正则化的量子对抗增强学习 (QARL) 是一种新方法,通过渐进式增加对手的理性来简化优化问题的复杂性,从而提高稳健性以及在多个 MuJoCo 运动和导航问题上的整体性能。