Jan, 2019
目标驱动机器人中从策略学习中分离特征提取: 评估状态表示学习的优劣
Decoupling feature extraction from policy learning: assessing benefits
of state representation learning in goal based robotics
TL;DR该论文提出了一种基于状态表示学习的方法用于实现机器人视觉控制中的高效强化学习,该方法包含多个状态表示学习方法,能够提高采样效率、提高性能、抗超参数变化,并编码所有相关特征。