May, 2023

MIMEx:基于掩码输入建模的内在奖励

TL;DR提出了一种用于探索的通用框架 Masked Input Modeling for Exploration (MIMEx),它能够通过灵活调整掩码分布来控制条件预测任务的难度,并在一系列挑战性的稀疏奖励视觉运动任务中取得了优异的结果。