双层规划的谓词发现

AAAIMar, 2022

Predicate Invention for Bilevel Planning

Tom Silver, Rohan Chitnis, Nishanth Kumar, Willie McClinton, Tomas Lozano-Perez...

TL;DR本文提出了一种从示例中学习抽象谓词的算法，通过优化可行但准确的替代目标，通过一组语法中提取的谓词集合进行爬山搜索，实验结果表明，我们的学习抽象能够快速解决悬而未决的任务，并优于六种基线。

Abstract

efficient planning in continuous state and action spaces is fundamentally hard, even when the transition model is deterministic and known.

efficient planning continuous state action spaces bilevel planning learning predicates

发现论文，激发创造

基于体验的关系状态抽象双层规划的主动学习

以对象为基础的环境中，提出一种基于在线互动的积极学习方法，用于自动学习谓词的诠释和符号规划的运算符，并使用这种方法来实现在机器人环境中的状态抽象和路径规划。

Mar, 2023

克服双层规划中操作学习中预测误差的陷阱

本文提出了一种在抽象环境上进行高层次搜索以指导低层次决策的双层规划方法，并使用符号操作和神经采样器学习操作和转换模型缩影，以实现连续状态和动作空间中长视野任务的有效求解。该文通过具有挑战性的 BEHAVIOR-100 基准中的 10 个不同混合机器人领域的实验表明，我们的方法可以学习到导致有效规划的操作，并且可以推广到新的初始状态，目标和对象上。

Aug, 2022

学习神经符号技能以进行双层规划

本研究中，通过将符号操作和神经采样器与参数化策略相结合，将它们打包成模块化的神经符号技能，并将其顺序化组合为搜索 - 采样二层任务和动作规划来解决新任务。在四个机器人领域的实验中，展示了具有神经符号技能的二层规划策略能够解决各种具有不同初始状态、目标和对象的任务，优于六个基线和消融。

Jun, 2022

使用深度学习为分层机器人规划引导抽象化

本研究介绍了一种使用深度神经网络自动生成机器人特定体系结构进行环境预测和自动计算抽象状态和动作的方法，得到的结果可用于提高机器人的规划性能和可靠性。研究结果表明，所学习的抽象状态和动作可以与一种新型的多源双向分层机器人规划算法配合使用，在测试环境中的计划时间上的表现比现有技术的基准方法提高了近 10 倍。

Feb, 2022

从语言中学习规划抽象化

该论文提出了一个学习状态和动作抽象的框架，利用带有语言注释的示范数据来自动发现符号化和抽象化的动作空间，并在此基础上引出一个潜在的状态抽象。框架包括三个阶段：恢复对象级和动作概念，学习状态抽象、抽象动作的可行性和转移模型，以及对抽象动作应用低级策略。在推断过程中，框架首先根据潜在的转移和可行性函数制定抽象动作计划，然后利用低级策略优化高级计划。该框架可以泛化到涉及新颖对象实例和环境、未见过的概念组合以及需要较长规划范围的任务场景中。

May, 2024

学习基于一阶符号计划的基础表达

本研究提出了一种新的学习规划模型的方法，其既有组合方法学习清晰的动作模板，又能够从图像空间中产生动作模板，这是结合前两种方法的优势的一步。

Apr, 2022

学习抽象世界模型用于值保持规划和选项

通过学习抽象 MDP（Markov 决策过程）来提高智能体在多任务环境中的决策和学习效率。

Jun, 2024

通过观察和学习世界的运作，发现利用 ' 赌博式 ' 选择进行规划的生活技能

该论文提出了一种利用历史交互观察和学习以合成抽象技能的规划代理的新方法，该方法基于马尔科夫状态空间模型，利用未知前提条件下的行动集合，并将技能公式化为基于当前状态提出行动计划的高层抽象策略，以此实现在嘈杂环境下自动学习稳健的高级技能。

Jul, 2022

学习神经符号关系转换模型用于双层规划

本研究提出了一种新型模型 NSRTs，它具有符号和神经组件，在很少的训练次数后就可以用于快速规划，并可以泛化到更多的物体和行为，具有数据高效的特点。

May, 2021

从状态空间结构学习规划的一阶符号表示

通过将规划器使用的一阶符号表示从编码状态空间结构的非符号输入中学习，我们解决了图像与符号之间的鸿沟，这意味着推断一个完整的一阶表示（即一般的动作模式、关系符号和对象）来解释所观察到的状态空间结构。

Sep, 2019