Feb, 2023

使用等价关系度量的聚类进行稳健的视觉强化学习并抵御干扰

TL;DR通过聚类与双模拟度量相结合的方式,提出了一种新颖的方法 (Clustering with Bisimulation Metrics, CBM),用于学习视觉信息的鲁棒表示,从而提高强化学习的样本效率。实验证明,CBM 显著改善了流行的视觉强化学习算法的样本效率,并在多个或单个干扰设置下实现了最先进的性能。