ICLRMar, 2022

可能性优先于效用:学习和使用分级的可用性

TL;DR本文介绍了一种基于 Hierarchical Affordance Learning 的方法,通过学习层次性可提供性模型来修剪不可能的子任务以实现更有效的学习,相对于非可提供性感知方法,HAL 代理能更好地学习复杂任务,规避环境中的随机性,获得多种技能,并且不需要外部监督。