Jun, 2023

可辨别因子分解的世界模型学习

TL;DR本文提出了 IFactor 框架,它由四类潜在状态变量建模,以捕捉强化学习系统中各种信息的不同方面,并在合成环境和深度强化学习环境中展示了其性能优于基线的实验结果。