Nov, 2022

最大熵深度逆强化学习评估城市感知安全性

TL;DR通过借鉴城市感知的专家评估政策,我们提出了一种新颖的基于IRL的框架来预测城市安全,并恢复相应的奖励函数,使用强化学习(MDP)来解决问题,并建立了一个基于众包的数据集SmallCity进行了研究。我们的结果表明,IRL在这个领域有着广阔的前景。