Oct, 2023

通过复位深度集合代理实现高效且安全的深度强化学习

TL;DR通过在重置方法中引入深度集成学习,我们提出了一种新的以增强样本利用效率为目标并解决基准重置方法局限性的方法。数值结果表明,该方法在高样本利用效率和安全性方面具有明显效果。