Jun, 2019

基于好奇心的多标准事后经验回放

TL;DR本文提出一种方法,将后见之明与好奇心驱动探索和课程学习相结合,以解决具有挑战性的稀疏奖励堆叠块任务,并且此方法成功地实现了在机器人手臂上堆叠两个以上的块,而无须使用人的演示。