AAAIDec, 2023

使用单类决策树从示范中学习安全约束

TL;DR自主代理与人类价值的对齐是部署这些代理到物理环境中时的一个关键挑战,安全性是其中一个重要关注点。为了解决这一挑战,我们提出了一种新的方法,利用一类决策树来从专家示范中进行学习。这些决策树以逻辑公式的形式表示与给定环境相关的一组约束条件。所学到的约束条件随后用于有约束的强化学习框架,实现安全策略的获取。与其他方法不同,我们的方法提供了约束条件的可解释性表示,这在安全关键环境中是一个至关重要的特性。为了验证我们提出方法的有效性,我们在合成基准领域和真实驾驶环境中进行了实验。