基于数据驱动的高度并行化最小干预共享控制 MPC
本研究使用部分可观察的马尔可夫决策过程(POMDP)建立了共享自主体系的模型,实现了在未知目标目的情况下,最小化期望成本并提供有用的援助,比传统预测 - 执行方法更快,需要更少的用户输入,减少用户闲置时间并减少用户与机器人的碰撞。
Jun, 2017
本研究介绍了一种新的基于共享自治导航系统的社会感知的辅助机器人平台,该平台以听取用户喜好为导向,实现了较安全、较自主的导航,以提高辅助移动技术在建筑环境中的可接受度。
May, 2024
本研究使用部分可观察马尔可夫决策过程来模拟共享自动化中的用户意图不确定性,并采用最大熵逆优化控制来估算用户目标的分布。研究还使用后见优化技术近似解决了优化问题。用户实验结果表明,该方法可以更快地完成任务,同时使用的输入较少,但用户对任务完成速度和控制权之间的平衡存在不同的评价。
Mar, 2015
我们提出了一种用于复杂多模态交通场景中可扩展实时模型预测控制(MPC)的分层体系结构。该体系结构包括两个关键组件:1)RAID-Net,一种基于注意力机制的新型循环神经网络,使用拉格朗日对偶性在 MPC 预测范围内预测自动车辆与周围车辆之间的相关交互;2)一个简化的随机 MPC 问题,通过消除无关的避撞约束,提高计算效率。我们的方法在一个模拟的交通路口中演示了交互式周围车辆,展示了在解决运动规划问题时的 12 倍加速。可以在此链接中找到展示该体系结构在多个复杂交通场景中的视频。
Feb, 2024
使用视觉、用户意图推断和人机共同控制的框架,旨在解决机器人远程操作系统中的挑战,同时缓解大脑 - 计算机接口下的噪音和错误低维度运动指令问题。我们使用共同控制辅助框架对两个使用了颅内脑机接口的受试者进行实验,并取得了显着的性能提升,在门的开启、从容器中倒液体和在密集且杂乱的环境中使用新型物品等任务中进一步展示了我们架构的可扩展性。
Mar, 2015
提出了一种模型自由、剩余策略学习算法来实现共享自主,将人与机器人的互补优势结合起来,以实现共同的目标,在 Lunar Lander 和 6-DOF quadrotor reaching task 两个连续控制环境中测试,表明此方法可以显著提高任务绩效。
Apr, 2020
本文介绍了一种基于频率的方法(Policy Dissection)用于 Reinforcement Learning (RL) 方法中的人机共享控制,该方法可将 RL 训练过的策略转化为可以与人类互动的策略,并在自动驾驶和动力学任务中进行了实验。
May, 2022
我们提出了一种基于物理的机器人控制器,可以在嘈杂的输入和意外跌倒的情况下实现高保真度的运动模仿和容错行为,并通过逐渐乘性控制策略在大规模动作数据库中学习,从而可实现对失败状态的恢复。
May, 2023
本文介绍了一种有效的基于模型预测控制的自适应方法,用于在具有挑战性的非结构化环境中实现自主系统的运行控制,以适应多样的环境和模型不确定性。
Mar, 2023