Sep, 2023

最大扩散强化学习

TL;DR通过利用各态过程的统计力学,提出了一种称为最大扩散增强学习的方法,在单次部署中可使代理能够连续学习,无论如何初始化。该方法可以去除代理经验之间的相关性,证明了其优于流行基准的最优性能,并为增强学习代理(如行走机器人和自动驾驶车辆)的透明和可靠决策铺平了道路。