在线行为选择实现稳健的现实世界操纵：世界是最好的模型

May, 2022

在线行为选择实现稳健的现实世界操纵：世界是最好的模型

"The World Is Its Own Best Model": Robust Real-World Manipulation Through Online Behavior Selection

Manuel Baum, Oliver Brock

TL;DR通过不断监测环境来观察任务的离散高级状态，机器人控制器可以根据不同的传感器模式来决定执行哪些控制器，从而实现对干扰的鲁棒性。我们通过将该思想作为离散状态的概率滤波器来实现这一目标。基于这个框架，我们提出了一个机器人系统，可以惊人地稳定地打开抽屉并从中抓取网球。

Abstract

robotic manipulation behavior should be robust to disturbances that violate high-level task-structure. Such robustness can be achieved by

robotic manipulation high-level task-structure robustness sensors probabilistic filter

发现论文，激发创造

部分可观测任务和运动问题中的信念空间在线重规划

本文提出了一个在线计划和执行系统，使用混合置信状态空间进行确定性代价敏感计划来选择成功概率高的观察行动和连续控制行动，以解决部分可观察问题，并在模拟和真实世界的厨房中展示了高效的解决方案。

Nov, 2019

使用引导式策略搜索学习接触丰富型操作技能

本文介绍了一种用于学习具有高度通用策略表示的动态操作行为的新方法，该方法可以扩展最近开发的策略搜索方法，并使用迭代重新拟合的时间变化线性模型来学习所需运动技能的一组轨迹，然后将这些轨迹统一到一个单一的控制策略中。

Jan, 2015

具有结构化世界模型的样本高效机器人学习

研究利用特征空间和世界模型提高机器人在可变形物体折叠任务中的学习效率和性能，结果发现使用特征点可以将最佳模型的性能提升 50％，学习效率也可以得到提升。

Oct, 2022

基于图像的熟练操作：通过细化引导实现自主现实世界强化学习

本文提出了一种基于视觉的程序自由编程的方法，利用强化学习实现复杂多指手势下的实物操作，无需手动建模或奖励工程。

Dec, 2022

在线动态适应和神经网络先验的一次性操作技能学习

本研究提出了一种基于模型的强化学习算法，将以前任务的先验知识与在线动态模型适应相结合，实现了高效学习，并且成功地应用于各种复杂机器人操纵任务。

Sep, 2015

ASID：机器人操作中的系统辨识主动探索

通过利用少量真实世界数据来自动完善模拟模型并规划准确的控制策略，在多个具有挑战性的机器人操作任务中，我们展示了这种模式对识别关节、质量和其他物理参数的有效性，并且说明了只需少量真实世界数据即可进行有效的模拟到真实世界的转换。

Apr, 2024

在线适应的人类模型分析

本研究模拟机器人学习算法为动态系统，控制为机器人观察到的人类数据，利用可达性分析和最优控制解决机器人在线学习参数的安全问题，并在自主驾驶和室内导航等四个领域展示了其实用性。

Mar, 2021

MoDem-V2: 用于真实世界机器人操作的视觉 - 动作世界模型

本研究通过模型强化学习、演示增强的方法，构建了一个能够直接在真实世界中学习联系丰富的灵巧操纵技能的系统 MoDem-V2，在模拟和实际环境中进行了实证研究，为直接在真实世界中进行演示增强的视觉模型强化学习提供了成功的案例。

Sep, 2023

具備固有物理知識的體雄動規劃

通过定义一组离散且临时的闭环控制器（称为 “任务”）以及引入一种对物理学和因果关系具有内在理解的监督模块，我们提出了一种解决在机器人技术中尚未实现的，使用纯闭环输入控制的复杂计划执行方法。我们通过模拟任务序列的执行并将结果存储在环境模型中，基于该模型构建计划，从而可以实现链式的临时闭环控制器。该框架已经在一个真实机器人上实施，并在两个场景中进行了概念验证。

Feb, 2024

学习设计和使用机器人操纵工具

通过深度学习和强化学习相结合的方法，本文提出了一种学习策略来解决机器人的操纵任务，并展示了比先前方法更高的样本效率、对未见过任务的适应性以及在实际约束条件下复杂性设计和控制策略之间的权衡。

Nov, 2023