Aug, 2022

使用隐马尔可夫模型的自动机学习任务自动化增强学习

TL;DR该论文提出了一种从代理环境经验中学习非马尔可夫任务规范的新方法,可以将任务拆分为其构成子任务,提高了 RL 代理后续合成最优策略的速率,并提供了一个可解释的编码高级环境和任务特征的方式。