Feb, 2024

深度强化学习中可转换的高斯奖励函数对于具有社交意识的导航

TL;DR机器人导航已从优先考虑避障转向采用能够适应人类存在的社交化导航策略,这导致社交化导航在机器人领域内具有显著地位。我们介绍并验证了可变高斯奖励函数(TGRF),该函数显著减轻了超参数调整的负担,在各种奖励函数中具备适应性,并在深度强化学习中展示加速学习速度,尤其在拥挤环境中表现出色,从而为机器人学中的更有效和适应性的方法铺平了道路。