Apr, 2023

基于结构信息原则的分层状态抽象

TL;DR本文提出了一种基于信息论的数学结构信息原则的状态抽象框架 SISA,该框架具有一种无监督的,自适应的层次状态聚类方法和一个优化编码树。与其他五种最先进的状态抽象方法相比,实验结果表明,SISA 可以有效地提高每轮回报和样本效率,且可灵活地与不同的表示学习目标相结合进一步提高性能。