BriefGPT.xyz
Jul, 2019
半监督和无监督技能探索的动态距离学习
Dynamical Distance Learning for Unsupervised and Semi-Supervised Skill Discovery
HTML
PDF
Kristian Hartikainen, Xinyang Geng, Tuomas Haarnoja, Sergey Levine
TL;DR
本篇论文研究了如何通过自主互动学习动态距离,并使用它们来提供良好的奖励函数,以便无需人为设计奖励函数或目标示例,使用半监督学习方法在实际机器人和仿真环境中有效地执行复杂任务。
Abstract
reinforcement learning
requires manual specification of a
reward function
to learn a task. While in principle this
reward function
only ne
→