MMNov, 2020

用强化学习学习最小作用量原理

TL;DR本文研究了在经典力学背景下,将 S 作为奖励函数,使用强化学习方法学习粒子在各种介质中传播的物理轨迹,通过在不同的折射率材料中传播的光线的情况来验证这个想法,并展示了智能体能够恢复等价于 Snell 定律或 Fermat 定律的最短时间路径。我们还讨论了强化学习与路径积分形式主义的相似性。