以对象为基础的环境中,提出一种基于在线互动的积极学习方法,用于自动学习谓词的诠释和符号规划的运算符,并使用这种方法来实现在机器人环境中的状态抽象和路径规划。
Mar, 2023
本文提出了一种在抽象环境上进行高层次搜索以指导低层次决策的双层规划方法,并使用符号操作和神经采样器学习操作和转换模型缩影,以实现连续状态和动作空间中长视野任务的有效求解。该文通过具有挑战性的 BEHAVIOR-100 基准中的 10 个不同混合机器人领域的实验表明,我们的方法可以学习到导致有效规划的操作,并且可以推广到新的初始状态,目标和对象上。
Aug, 2022
本研究中,通过将符号操作和神经采样器与参数化策略相结合,将它们打包成模块化的神经符号技能,并将其顺序化组合为搜索 - 采样二层任务和动作规划来解决新任务。在四个机器人领域的实验中,展示了具有神经符号技能的二层规划策略能够解决各种具有不同初始状态、目标和对象的任务,优于六个基线和消融。
Jun, 2022
本研究介绍了一种使用深度神经网络自动生成机器人特定体系结构进行环境预测和自动计算抽象状态和动作的方法,得到的结果可用于提高机器人的规划性能和可靠性。研究结果表明,所学习的抽象状态和动作可以与一种新型的多源双向分层机器人规划算法配合使用,在测试环境中的计划时间上的表现比现有技术的基准方法提高了近 10 倍。
Feb, 2022
该论文提出了一个学习状态和动作抽象的框架,利用带有语言注释的示范数据来自动发现符号化和抽象化的动作空间,并在此基础上引出一个潜在的状态抽象。框架包括三个阶段:恢复对象级和动作概念,学习状态抽象、抽象动作的可行性和转移模型,以及对抽象动作应用低级策略。在推断过程中,框架首先根据潜在的转移和可行性函数制定抽象动作计划,然后利用低级策略优化高级计划。该框架可以泛化到涉及新颖对象实例和环境、未见过的概念组合以及需要较长规划范围的任务场景中。
May, 2024
本研究提出了一种新的学习规划模型的方法,其既有组合方法学习清晰的动作模板,又能够从图像空间中产生动作模板,这是结合前两种方法的优势的一步。
Apr, 2022
通过学习抽象 MDP(Markov 决策过程)来提高智能体在多任务环境中的决策和学习效率。
Jun, 2024
该论文提出了一种利用历史交互观察和学习以合成抽象技能的规划代理的新方法,该方法基于马尔科夫状态空间模型,利用未知前提条件下的行动集合,并将技能公式化为基于当前状态提出行动计划的高层抽象策略,以此实现在嘈杂环境下自动学习稳健的高级技能。
Jul, 2022
本研究提出了一种新型模型 NSRTs,它具有符号和神经组件,在很少的训练次数后就可以用于快速规划,并可以泛化到更多的物体和行为,具有数据高效的特点。
May, 2021
通过将规划器使用的一阶符号表示从编码状态空间结构的非符号输入中学习,我们解决了图像与符号之间的鸿沟,这意味着推断一个完整的一阶表示(即一般的动作模式、关系符号和对象)来解释所观察到的状态空间结构。
Sep, 2019