Jun, 2019

末端执行器空间中的可变阻抗控制:接触丰富任务中的强化学习动作空间

TL;DR本文研究了深度强化学习中不同行为空间的影响,提出了在约束和接触丰富任务中具有优势的终端执行器空间下的可变阻抗控制(VICES)。通过在三个典型的操作任务中评估多个动作空间,表明 VICES 提高了样本效率,在所有三个实验设置中保持低能量消耗,并确保安全。