Jun, 2023

逆强化学习的课程子目标

TL;DR本研究提出了一种基于课程子目标的反向强化学习框架,通过动态选择子目标来引导智能体的学习,在 D4RL 和自动驾驶基准测试中实现了优于现有方法的结果与更好的可解释性。