ICLRJan, 2019

目标驱动机器人中从策略学习中分离特征提取:评估状态表示学习的优劣

TL;DR该论文提出了一种基于状态表示学习的方法用于实现机器人视觉控制中的高效强化学习,该方法包含多个状态表示学习方法,能够提高采样效率、提高性能、抗超参数变化,并编码所有相关特征。