Sep, 2020

从强化学习中分离表示学习

TL;DR该研究提出了一种从图像中训练深度强化学习模型的新方法,称为增强时序对比学习(ATC),该方法训练一个卷积编码器以用对比损失关联短时间差别的图像对,并成功应用于多个模拟实验中以实现代理在 RL 任务中更好的性能。