利用最大熵的非线性 IRL 框架,通过采集的人类行为驾驶数据,使用 Fully Convolutional Neural Networks (FCN) 表示驾驶行为的成本模型,直接构建出代替人类驾驶行为的代价图,以此实现机器人高仿真的驾驶行为,且表现出较强的可伸缩性和鲁棒性。
Jul, 2016
本研究提出了一种组合模型,结合卷积神经网络和图神经网络,用于多机器人路径规划中的通讯问题,并在模拟中取得了接近专家算法的性能和有效性。
Dec, 2019
本研究使用全卷积神经网络,在 LIDAR 点云、GPS-IMU 信息和 Google 驾驶方向的帮助下生成驾驶路径,并通过测试获得了良好的性能,标志着该系统有望填补底层场景解析和行为反射方法之间的差距。
Mar, 2017
本研究采用预先训练的方式将人类先验知识引入深度逆强化学习,实现了更高的鲁棒性,更明显的障碍物边界以及能够捕捉纯学习模型无法捕捉的障碍物实例,这使得最终的模型可以更准确地处理包括楼梯、坡道和地下通道在内的稀有案例。
Dec, 2016
教授自主移动机器人在人群中成功导航是一项具有挑战性的任务,该论文采用神经网络来学习机器人在现场的特定策略,以考虑人类行为和对真实机器人的反应,同时针对各种情景学习相应策略,并对方法、实验结果进行了定量评估。
Apr, 2024
提出了一种机器人系统的新方法,其中一个较大系统的每个构件都表示为可微分的程序,即深度神经网络,应用到一个具有挑战性的部分可观测机器人导航任务中。在预测性模拟实验中,成功训练 Navigation Networks(NavNets)来解决这个具有挑战性的部分可观察的导航任务。
Jul, 2018
本文提出了基于强化学习(RL)的方法来解决移动机器人在密闭空间中与行人互动的导航问题,探索了多个场景下训练准则的可复用性,并在两个真实环境的三维重建中表现出了良好的迁移能力。
Oct, 2020
本文提出了一种卷积神经网络(CNN)人类轨迹预测方法,相比于当前的方法更加快速但仍保持具有竞争力的结果,这对于共享人类环境的自主机器人与人类之间的精确和高效互动至关重要。
Sep, 2018
通过提出三个小型,计算成本较低的深度端到端神经网络模型,直接从输入图像中产生驾驶控制信号,并利用深度和薄型全卷积网络与递归神经网络以及低参数计数等方法来解决复杂的端到端回归任务,预测转向和加速度指令,并包括分类优化层,以允许网络隐式地学习图像语义。我们证明,与最新的可比较的端到端驾驶网络相比,所得到的网络使用了 3 倍少的参数以及比 AlexNet 变化小 500 倍,同时维持对于过拟合的稳健性。
Nov, 2017
使用递归卷积神经网络的值迭代,以及部分可观测环境下的状态信念传递和最佳行动选择来更好地利用强化学习问题的固有结构,通过 RCNNs 回传梯度允许系统显式地学习与底层 MDP 相关联的变换模型和奖励函数,这是经典基于模型的 RL 的一种优秀替代方法。我们通过机器人规划问题的仿真来评估所提出的算法,并展示了我们框架降低重新规划成本、学习准确的 MDP 模型以及使用学习的模型重新规划以实现接近最优策略的能力。
Jan, 2017