ICLRMar, 2017

深度特征与拟合 Q 迭代的视觉伺服学习

TL;DR本文基于学习的视觉特征、学习的预测动态模型和强化学习相结合的方法,研究了视觉伺服机制的学习。通过在学习到的视觉特征空间内,代替图像像素和手动设计的关键点,我们演示了该方法可以在样本效率方面获得两个数量级以上的提高,并在复杂的合成汽车跟踪基准测试中表现出了显著的改进。