Jun, 2023

Granger因果层次技能发现

TL;DR介绍了一种新算法 Hierarchy of Interaction Skills(HIntS),利用 Granger causality 无监督地发现和使用交互探测器训练层次化的技能,解决了强化学习中样本效率低和泛化问题。在机器人推动障碍物任务中,可以将学习到的技能应用到其他相关任务中,并在效率和性能方面显著提高。