Feb, 2022

通过想象近未来来实现安全强化学习

TL;DR本研究关注应用于现实世界问题中的强化学习算法,提出了一种基于模型的算法可以规避不安全状态并降低安全违规,在连续控制任务中取得相当的回报.