ICMLAug, 2020

安全关键环境下的强化学习谨慎自适应

TL;DR提出一种安全关键的适应性强化学习任务设置和解决方案 CARL,通过以多样化环境中的先前经验来评估风险,实现对新领域的谨慎探索并避免灾难状态,为城市驾驶等安全关键环境下的强化学习提供可行性。