Mar, 2024

利用动力学中的对称性进行有偏向奖励的基于模型的强化学习

TL;DR通过 Cartan 的运动参考系方法,我们提出了一种学习动力学模型的技术,该模型具有指定的对称性,并通过数值实验证明所提出的方法可以学习出更准确的动力学模型。