ICMLJan, 2019

通过潜在状态解码的丰富观测下可证明的高效强化学习

TL;DR该论文研究了在具有大量从少量潜在状态生成的丰富观察结果的情节 MDPs 中的探索问题。在某些可辨识性假设下,研究人员通过一系列回归和聚类步骤归纳地估计了从观察到潜在状态的映射,并使用它构建了良好的探索策略。