使用展开马尔可夫随机场合成未明确任务的操纵序列

ICMLJun, 2013

使用展开马尔可夫随机场合成未明确任务的操纵序列

Synthesizing Manipulation Sequences for Under-Specified Tasks using Unrolled Markov Random Fields

Jaeyong Sung, Bart Selman, Ashutosh Saxena

TL;DR研究提出了一种基于 Markov 随机场（MRF）的动态规划策略，通过训练参数可以更好地适应不确定的人工环境，并且可以通过一系列原始动作或控制器来表达高水平任务，经过详细的实验验证，该方法可以成功地规划各种任务。

Abstract

Many tasks in human environments require performing a sequence of navigation and manipulation steps involving objects. In unstructured human environments, the location and configuration of the objects involved often change in unpredictable ways. This requires a high-level planning strategy that is robust and flexible in an →

dynamic planning markov random field maximum margin learning uncertain environment primitive actions

发现论文，激发创造

主动任务随机化：提出可行且新颖的任务以学习序列操作的视觉动作技能

本研究提出了主动任务随机化（ATR）的方法，通过自动创建合理而新颖的任务，学习了一种适用于顺序操作的视觉运动技能，证明了这种方法比基线方法效果更好。

Nov, 2022

通过交替进行多智能体路径规划和基于物理模拟的操作，实现可移动物体的复杂非抓取操作规划

该研究针对机器人在重复环境中的可操作性，提出一种基于物理模拟器的动态规划算法，结合多智能体路径规划的思想，用于实现机械臂动作计划与可移动物体状态变化之间的交互式自主调整。

Mar, 2023

N$^2$M$^2$: 在未知和动态环境中学习任意移动操作导航

本研究提出一种名为神经导航移动操控（N$^2$M$^2$）的方法，通过将移动操控任务分解为任务空间中的简化运动生成器和移动基地的训练强化学习代理，同时通过对复杂障碍环境的扩展，可以在未知环境中执行不可见、长视距任务，并立即对动态障碍和环境变化做出反应。

Jun, 2022

动态环境下人机多智能体系统的最佳任务与动作规划及执行

本文提出了一种联合任务和运动规划方法来优化任务的排序、分配和执行，解决多智能体系统中的时空变异性问题，采用时间轴规划处理任务的时间约束、时间变化和协同分配，在网络平面规划中以环境变化为前提，证明了该方法的有效性。

Mar, 2023

使用参数化操作基元学习外在灵巧性

通过学习层次化强化学习，我们能够利用环境改变目标物体的姿态，无需物体检测、姿态估计或手动设计控制器，从而成功地完成 98% 的实验任务。

Oct, 2023

学习机器人技能组合模型，用于任务和动作规划

该研究旨在通过学习使用感知运动基元来解决复杂的长期规划操作问题，其需要将基本技能组合成新的技能来推广应用于广泛的问题中，同时使用高效的主动学习和采样方法，将学习和规划方法结合来规划各种复杂的动态操作任务。

Jun, 2020

FFRob: 利用符号规划实现高效的任务和运动规划

介绍了 FFRob 算法，它使用 Extended Action Specification (EAS) 作为一般性的计划表示来支持任意谓词为条件。通过使用批量采样操纵基元和一个多查询路网结构来迭代离散化任务和运动规划问题，FFRob 可以有效地计算启发式，并结合几何和运动学规划约束，给出距离目标的紧密估计。同时，FFRob 也是概率上完备并且具有有限的期望运行时间。

Aug, 2016

面向机器人操作的指导驱动历史感知策略

本研究提出了一种基于 Transformer 的方法来处理人类语言指令和多视角场景观察，以提高机器人的精准操作，并在 RLBench 基准测试中成功实现 74 项任务，还表现出对未曾见过变化的任务的良好泛化性能。

Sep, 2022

可移动物体操作规划：确定哪些物体去哪里、以何种顺序和方式

本文介绍了一种基于多智能体路径规划和非抓取式推动规划的机器人操纵方法，该方法可以在混乱和受限的三维工作空间中移动物体，并利用刚体物理模拟器检查路径是否满足物理约束，通过改进后的算法在实际机器人操作和模拟操作中优于其他现有算法。

Mar, 2023

使用引导式策略搜索学习接触丰富型操作技能

本文介绍了一种用于学习具有高度通用策略表示的动态操作行为的新方法，该方法可以扩展最近开发的策略搜索方法，并使用迭代重新拟合的时间变化线性模型来学习所需运动技能的一组轨迹，然后将这些轨迹统一到一个单一的控制策略中。

Jan, 2015