Feb, 2024

高维度探索中的聚类和预训练表示方法

TL;DR该论文采用密度估计问题的视角,研究在强化学习中基于表示的探索方法,提出了在 3D 环境中使用聚类表示进行探索的有效性,并探索了随机表示和预训练 DINO 表示进行聚类计数状态的方法,最终在 VizDoom 和 Habitat 环境中证明了该方法在探索方面优于其他已知方法。