May, 2024

学习潜在动态健壮表示的世界模型

TL;DR利用视觉模型仿真提升强化学习效果,通过空时屏蔽策略和混合循环状态空间模型来准确捕捉环境的重要特征,以提高策略的学习与表现。