ICMLJul, 2020

群等变深度强化学习

TL;DR本文提出使用 Equivariant CNNs 训练强化学习智能体并研究其在对称变换方面的归纳偏差,结果表明在高度对称的环境中,使用 Equivariant CNNs 可以显著提高智能体的性能和样本效率,同时还需要更少的参数,而且它们对仿射变换引起的环境变化具有鲁棒性。