Aug, 2023

改进社交机器人导航的强化学习训练方式

TL;DR自主移动机器人在人类空间中导航必须遵守社会规范。本研究提出了一种使用课程学习来改善强化学习社交导航方法的泛化性能的方法。通过使用多种环境类型和多种动力学模型对行人进行建模,逐步增加训练的多样性和难度。研究结果表明,与之前的训练方法相比,使用课程学习进行训练可以取得更好的泛化性能。此外,我们还验证了训练方法在比训练中使用的更大更拥挤的测试环境中的有效性,从而对模型的性能进行更有意义的衡量。