AAAINov, 2022

在轨迹数据中检测对称性以提供更有意义的强化学习表示

TL;DR本研究提出了一种使用神经网络自动检测强化学习系统对称性并生成高级表示的方法,并在两个模拟环境中进行实验来证明此方法的可行性。