AAAISep, 2021

在黑盒元强化学习中引入对称性

TL;DR本文研究了元强化学习中的对称性在元泛化中的作用,我们发现对称性和黑盒元强化学习系统中通常不存在的神经网络可以帮助提高算法泛化性能。通过实验验证,加入这些对称性可以使算法更好地推广到未见过的行动和观测空间、任务和环境之中。