Feb, 2023

可控感知的无监督技能探索

TL;DR提出了一种新的无监督技能发现方法,名为 CSD,它可以主动寻求难以控制的复杂技能,包括机器人操作和运动技能。该方法使用可控性感知距离函数对状态转换进行评估,并结合距离最大化技能发现方法,在无监督下逐步学习更具挑战性的技能,在六个机器人操作和运动环境下表现显著优于之前的方法。