May, 2023

具有子目标预测的目标条件监督学习

TL;DR本文介绍了一种基于 “目标条件下的先验知识学习”(GCSL)算法的延伸方法 TraIL,在原有算法基础之上,通过利用轨迹的信息来预测动作和目标子目标,从而使得智能体可以在更多的目标状态下取得更好的性能表现。