BriefGPT.xyz
Oct, 2020
学习保证安全:带安全评论家的深度强化学习
Learning to be Safe: Deep RL with a Safety Critic
HTML
PDF
Krishnan Srinivasan, Benjamin Eysenbach, Sehoon Ha, Jie Tan, Chelsea Finn
TL;DR
为了将RL算法部署到实际场景中并在学习过程中确保安全性,我们提出了使用转移学习方法学习在一个任务环境中如何保持安全性,然后将所学用于约束在学习新任务时的行为,此方法在三个具有挑战性的领域中实证,相比于标准的深度RL技术和以前的安全RL方法,我们的方法不但减少了安全事故,还提高了学习的速度和稳定性。
Abstract
safety
is an essential component for deploying
reinforcement learning
(RL) algorithms in real-world scenarios, and is critical during the learning process itself. A natural first approach toward safe RL is to man
→