Feb, 2024

DIGIC:通过因果发现实现领域通用的模仿学习

TL;DR通过利用演示数据分布发现领域泛化策略的因果特征,我们设计了一个名为 DIGIC 的新框架,通过因果发现从演示数据分布中找到专家行为的直接原因,实现了只使用单一域数据进行领域泛化模仿学习,并且在底层因果模型的非结构化假设下作为跨域变化方法的补充,我们在各种控制任务中进行的实证研究表明,所提出的框架显著提高了领域泛化性能,并且与原始域中的专家具有可比较的性能。