Nov, 2022

多视角探索最大化解决视觉控制问题

TL;DR本研究提出了 MEM: Multi-view Exploration Maximization 模型,它是第一种将多视图表示学习与内在奖励驱动的探索相结合的强化学习方法。实验结果表明,MEM 可以在高维环境和稀疏奖励空间下显着提高强化学习代理的样本效率和泛化能力,从而解决现实世界复杂的视觉控制任务。