Oct, 2024

无数据增强的视觉基础强化学习的零样本泛化

TL;DR本研究解决了视觉基础强化学习(RL)代理在新环境中的泛化难题,提出了一种新的模型——关联潜在解耦(ALDA),它结合潜在解耦和联想记忆模型实现零样本泛化,避免了数据增强的依赖。研究表明,数据增强技术实际上是一种弱解耦形式,这一发现对强化学习的训练方法具有重要影响。