IJCAIMar, 2021

马尔可夫决策过程相似性度量的分类方法

TL;DR本文研究任务相似性、转移学习及相似性度量等问题,提出 MDP 相似性指标分类方法,并分析其相关定义,最后对现有学说进行综述和未来发展方向的探讨。