Sep, 2018

基于拓扑表示的强化学习在带整臂操作的人体运动中的应用

TL;DR本文利用基于拓扑的坐标将任务建模为强化学习问题,以直接响应外部干扰和人体动作的行为方式,学习生成运动,解决某些救援或病人护理场景中的大型物品运输。仿真动态海上救援场景并进行定量实验,展示学习策略可以解决不同形状的人类,漂浮的人类或感知噪声。我们的定性实验展示了持续保持后的运输,证明了该策略可以直接转移到实际场景中。