Nov, 2021

基于后继特征标志的长视程目标导向强化学习

TL;DR本文介绍 Successor Feature Landmarks(SFL),它是用于大型、高维空间的探索的一个框架,该框架利用继承特征(SF)的能力来驱动探索,估计状态新颖性,并通过将状态空间抽象为基于非参数地标的图表,启用高级别规划,实现了 GCRL 任务上的超越表现。