AAAIMar, 2023

RePreM: 用带掩码模型的表示预训练进行强化学习

TL;DR通过使用遮蔽模型进行预训练,提出了适用于 RL 的遮蔽模型预训练方法 RePreM,避免了算法复杂性和数据增强的问题,并通过各种任务的实验证明了其有效性。