Jun, 2023

强化学习中的观测转移泛化

TL;DR本文提出了一种基于 bisimulation 的模拟器学习方法,在考虑环境变化的情况下,使用备选观测来学习一个对观测变换不变的表示空间,以实现对测试阶段环境的适应,并在高维图像控制领域上进行实证分析。