Dec, 2023

视觉回顾自我模仿学习中的交互式导航

TL;DR通过返朔目标重新标注和自我模仿,本研究在视觉导航任务中提出一种新颖的方法,Visual Hindsight Self-Imitation Learning (VHS),以提高样本利用效率,并通过已有的目标观察衍生出原型目标嵌入方法,在视觉和部分可观察的环境下表现出显著有效性。实验结果证实了 VHS 在交互式视觉导航任务中优越的性能和样本利用效率。