Jun, 2020

通过观看 YouTube 视频进行语义视觉导航

TL;DR本文通过简单地观看 YouTube 视频,利用 Q-learning 对伪标记过的转移数据进行离线学习来获取语义线索,进而在视觉仿真中实现目标导航任务,相较于端到端 RL、行为克隆和传统方法,使用最少的直接交互能够获得相对提高 15-83% 的效率。