May, 2022

在线行为选择实现稳健的现实世界操纵:世界是最好的模型

TL;DR通过不断监测环境来观察任务的离散高级状态,机器人控制器可以根据不同的传感器模式来决定执行哪些控制器,从而实现对干扰的鲁棒性。我们通过将该思想作为离散状态的概率滤波器来实现这一目标。基于这个框架,我们提出了一个机器人系统,可以惊人地稳定地打开抽屉并从中抓取网球。