ICMLSep, 2019

领域自适应模仿学习

TL;DR介绍了一种领域自适应模仿学习(DAIL)问题的形式化表达,提出了一种两步方法:对齐和适应,通过无监督的 MDP 对齐算法(GAMA)执行对齐步骤并利用对应关系在不需要经过环境交互的情况下在不同领域中实现任务零次模仿。