May, 2023

强化学习中的分离表示条件互信息

TL;DR本研究提出了一种针对强化学习中存在相关特征的高维观察数据的辅助任务方法,通过最小化表示中特征的条件互信息来学习解缠缚表示,以提高对相关性变化的泛化能力。实验结果表明,该方法可以提高强化学习算法的训练性能和泛化能力。