Feb, 2024

可解释的生成对抗拟态学习

TL;DR提出了一种新颖的模仿学习方法,结合了信号时态逻辑(STL)推理和控制综合,能够明确地表示任务作为一个 STL 公式,在理解学习代理的具体任务方面提供了清晰的理解,并通过手动调整 STL 公式将人类知识纳入,以便适应新的场景。此外,我们采用了生成对抗网络(GAN)受启发的训练方法,既能进行推理,又能进行控制策略,有效地缩小了专家策略和学习策略之间的差距。通过两个案例研究,证明了我们算法的有效性,展示了其实际应用性和适应性。