Feb, 2022

使用状态观察器从视频中进行对抗性模仿学习

TL;DR介绍了一种名为 Visual Generative Adversarial Imitation from Observation using a State Observer (VGAIfO-SO) 的新算法,该算法使用自我监督的状态观察器从高维图像中提供低维本体感知状态表示的估计,从而更有效地从仅视频演示中学习,并且有时可以实现接近于有特权访问演示者本体感知状态信息的 GAIfO 算法的性能。