ICCVMay, 2017

使用深度继承表示进行视觉语义规划

TL;DR本文提出了一种基于强化学习和模仿学习的视觉语义计划解决方案,使用后继表示来实现跨任务的泛化,用于预测将动态环境从初始状态转换到目标状态的操作序列,在 THOR 环境中实现了近乎最优的结果。