线上建模用于离线规划的立场文件
本研究提出了一个新型的轻量级基于模型的离线规划框架 MOPP,通过通过学习数据中的行为策略鼓励更激进的轨迹回放,并修剪出问题轨迹,以避免潜在的超出分布样本,相对于现有模型的离线规划和 RL 方法表现更具有竞争性。
May, 2021
本文介绍了一种自主学习的方法,通过无标注的高维真实值机器人轨迹,自动学习抽象状态和动作的可推广的基于逻辑的关系表示,形成了自动发明的类似 PDDL 的领域模型。通过确定性设置的实证结果表明,仅凭少量机器人轨迹就可以学习到强大的抽象表示,所学的关系表示包括但超越了高级动作的经典直观概念,并且学习的模型使得规划算法能够扩展到以前超出手工构思抽象的任务范围。
Feb, 2024
本文提出了一种新的过程规划公式,通过贝叶斯推论和基于模型的模仿学习,建模人类行为,从而在实际的指导视频中实现了它,证明了我们的方法可以实现达到指定目标的最先进性能的同时,学习到的上下文信息以潜在空间的形式表现出有趣的特征。
Oct, 2021
通过将规划器使用的一阶符号表示从编码状态空间结构的非符号输入中学习,我们解决了图像与符号之间的鸿沟,这意味着推断一个完整的一阶表示(即一般的动作模式、关系符号和对象)来解释所观察到的状态空间结构。
Sep, 2019
本文采用范畴论的数学理论和图形语法对 PDDL 中的领域、问题和计划进行模型建模,通过将行动视为不同字面意义之间的映射,以描述动作之间的依赖性和选定的方案,并提供了一种图形语法和线性记法,以便推断计划的每一步所使用的替代方案。
Jul, 2021
该论文对经典规划的重组技术的大量研究进行了系统综述,旨在提供该领域的整体视图,并促进未来的研究。作为一个有形的结果,我们提供了现有技术分类的定性比较,这可以帮助研究人员获得它们的优点和缺点的概述。
Jan, 2023
Ada 使用语言模型从任务通用的背景知识中自动构建特定任务的规划表示,通过与其他使用语言模型进行顺序决策的方法相比,在两个基准任务上表现出更准确的计划和更好的任务复杂性泛化能力。
Dec, 2023
本论文提出了一种利用自然语言处理和约束满足技术从文本描述中学习行动模型的方法,通过构建一种新型语言模型提取计划轨迹并建立一组约束条件来生成行动模型。实验结果表明这种方法是有效而高效的。
Feb, 2022