Sep, 2017

使用人类演示进行神经网络预训练的深度强化学习

TL;DR通过使用小规模的人类演示来完成深度强化学习网络的预训练,可以更好地发现特征,并且可以使训练时间显著缩短,并可在 Atari 2600 游戏中实现。