Dec, 2023

ReCoRe:世界模型的正则化对比表示学习

TL;DR通过对比无监督学习和介入不变正则化的使用,提出了一种学习不变特征的世界模型,以改善强化学习在视觉导航等日常任务中的限制,并在 iGibson 基准测试中取得显著的性能提升。