目标驱动机器人中从策略学习中分离特征提取: 评估状态表示学习的优劣

Jan, 2019

目标驱动机器人中从策略学习中分离特征提取: 评估状态表示学习的优劣

Decoupling feature extraction from policy learning: assessing benefits of state representation learning in goal based robotics

HTML

PDF

Antonin Raffin, Ashley Hill, Kalifou René Traoré, Timothée Lesort, Natalia Díaz-Rodríguez...

TL;DR该论文提出了一种基于状态表示学习的方法用于实现机器人视觉控制中的高效强化学习，该方法包含多个状态表示学习方法，能够提高采样效率、提高性能、抗超参数变化，并编码所有相关特征。

Abstract

Scaling end-to-end reinforcement learning to control real robots from vision presents a series of challenges, in particular in terms of sample efficiency. Against end-to-end learning, →