Mar, 2020

传感器漂移下的模仿学习与决策的因果转移

TL;DR该研究提出了一种基于因果模型的框架,解决了学习者、演示者和训练代理不同的传感器输入(sensor-shifts)导致的问题,在两个常见的LfD任务中进行转移学习:(1)推断演示者的行为效应和(2)模仿学习。