陌生人危险！基于RL的社交机器人导航中的识别与避让不可预测行人

Jul, 2024

陌生人危险！基于RL的社交机器人导航中的识别与避让不可预测行人

Stranger Danger! Identifying and Avoiding Unpredictable Pedestrians in RL-based Social Robot Navigation

Sara Pohland, Alvin Tan, Prabal Dutta, Claire Tomlin

TL;DR通过改进学习流程，我们提出了一种社交注意力强化学习（SARL）策略，该策略在不熟悉情况下能够保持足够的谨慎，并通过修改训练过程、更新价值网络和实现奖励函数等方式，有效减少碰撞和减少人行道上个体空间的占用时间。

Abstract

reinforcement learning (RL) methods for social robot navigation show great success navigating robots through large crowds of people, but the performance of these learning-based methods tends to degrade in particu

发现论文，激发创造

具有深度强化学习的社会感知运动规划

使用深度强化学习，本文研发了一种尊重人们常见社交规范的导航策略，可以使机器人车辆在行人密集的环境中以人类步速进行完全自主导航。

Mar, 2017

基于关注交互图的意图感知机器人人群导航

本文提出一种基于循环图神经网络和注意力机制的新型RL方法，通过捕捉时空中多种交互类型来预测人类行为意图，并将该预测应用于无模型RL框架中以避免机器人干扰其他个体，从而在人群中实现机器人的安全、高效导航。

Mar, 2022

SoLo T-DIRL: 基于轨迹排序深反馈强化学习的社会感知动态局部路径规划器

本文提出了一种社交感知动态本地规划器的新框架，通过利用最近提出的轨迹排序最大熵深逆强化学习方法，从人类演示中学习奖励函数并显式地考虑社交互动因素和社交感知因素，同时提出使用机器人周围行人的突然速度变化来进行轨迹排名评分，从而解决人类演示中的次优问题。实验表明，该方法能够成功地使机器人在拥挤的社交环境中导航，并在成功率、导航时间和入侵率方面优于现有的社交导航方法。

Sep, 2022

利用接近感知任务实现社交导航

本文提出了一种基于Proximity-Aware Tasks进行增强学习的社交导航策略，该策略利用干涉Social Behaviors的能力，解决在室内环境中人类导航的挑战，模拟了最小的人机交互单元——遭遇。在Gibson4+和Habitat-Matterport3D数据集上实现了该策略。

Dec, 2022

评估社交机器人导航算法的原则和指南

本文提出了评估社交机器人导航算法的标准、度量方式和基于场景分析的指导方针，并设计了一个社交导航度量指标框架来比较不同的模拟器、机器人和数据集的结果。

Jun, 2023

改进社交机器人导航的强化学习训练方式

自主移动机器人在人类空间中导航必须遵守社会规范。本研究提出了一种使用课程学习来改善强化学习社交导航方法的泛化性能的方法。通过使用多种环境类型和多种动力学模型对行人进行建模，逐步增加训练的多样性和难度。研究结果表明，与之前的训练方法相比，使用课程学习进行训练可以取得更好的泛化性能。此外，我们还验证了训练方法在比训练中使用的更大更拥挤的测试环境中的有效性，从而对模型的性能进行更有意义的衡量。

Aug, 2023

学习多模态感知的社交机器人导航的研究

自主移动机器人需要通过其载有的传感器(如LiDAR和RGB相机)感知环境，并做出适当的导航决策，为了在人类居住的公共空间中导航，这个导航任务不仅仅是避开障碍物，还需要考虑周围的人类及其意图，以对应社会规范进行导航行为的微小变化，机器学习方法在以数据驱动的方式捕捉这些复杂而微妙的社交互动方面显示出了有效性，而无需显式手工制作简化模型或代价函数，考虑到多种可用传感器模态和学习方法的效率，本文通过使用大规模真实数据集对使用多模态感知学习社交机器人导航进行了全面的研究，该研究分析了在不同社交场景中的全局和局部规划水平上的社交机器人导航决策，并将单模态和多模态学习与一组经典导航方法进行对比，同时从学习的角度分析了训练和泛化性能，我们还进行了一个人体研究，探究了使用多模态感知进行学习如何影响感知到的社交合规性，结果表明，与单模态学习相比，多模态学习在数据集和人体研究中具有明显优势，我们开源了代码，供社区在未来研究中使用多模态感知学习社交机器人导航。

Sep, 2023

社交集成导航：基于深度强化学习的社交行为机器人

移动机器人在各种拥挤场合中得到广泛应用，社会接受的导航行为是可扩展应用和人类认可的必要条件。深度强化学习方法被用于学习机器人的导航策略和模拟机器人与人类之间的复杂互动。通过在与人类互动的环境中训练深度强化学习策略，我们提出了一种新颖的社会整合导航方法，该方法适应性地产生机器人的社会行为，并且在距离行驶、完成时间和对环境中所有代理的负面影响方面优于社会感知方法。

Mar, 2024

在共享空间中的自动驾驶车辆群体导航用于不确定性感知的深度强化学习

在人行道密集的环境中，安全、符合社会要求且高效的低速自主车辆的导航需要考虑行人的未来位置以及与车辆和其他人的互动。本研究提出了一种集成预测和规划方法，该方法在模型无关的深度强化学习算法的训练中考虑了预测的行人状态的不确定性。通过引入一种新的奖励函数，该方法促使自主车辆尊重行人的私人空间，在接近行人时减速，并最小化与其预测路径的碰撞概率。结果显示，与不考虑预测不确定性的最先进的模型相比，本方法降低了40%的碰撞率，并增加了15%的与行人的最小距离。此外，该方法在性能和计算时间方面超过了采用相同预测不确定性的模型预测控制方法，并产生了更接近于人类驾驶员在类似场景中的轨迹。

May, 2024

学习人类感知路径规划的社交成本函数

通过识别常见的社交场景并修改传统规划器的成本函数以适应这些场景，我们提出了一种新方法，使机器人能够执行在其他情况下无法出现的不同的社交导航行为，并保持传统导航的鲁棒性。

Jul, 2024