May, 2022

CCLF:一种对比-好奇驱动的学习框架,用于高效强化学习

TL;DR在本文中,我们提出了一个模型无关的对比学习框架(CCLF),通过对经验回放进行对比学习和自我学习来利用重要的样本,更高效地学习表示,从而大大减少数据增强的样本数量。我们的方法在多个基础强化学习算法上以及DeepMind Control Suite、Atari和MiniGrid 基准测试上表现出了超越其他最先进方法的样本效率和学习性能。