Feb, 2018

多样性即是你所需:无需奖励函数学习技能

TL;DR本文提出了一种无需奖励函数却能学习有用技能的方法 DIAYN(“多样性就是你所需的一切”),其通过最大化信息理论目标来实现技能的学习,在多项模拟机器人任务中取得了良好的表现,并且能够服务于其它强化学习相关的挑战。