线上建模用于离线规划的立场文件

Jun, 2022

线上建模用于离线规划的立场文件

Position Paper: Online Modeling for Offline Planning

Eyal Weiss, Gal A. Kaminka

TL;DRAI 规划研究中，规划问题的定义和表达是关键。文章建议改变规划流程，采用在线建模与离线规划的方式，以更好地适应现实需求，并提出了一个基于动作成本估计的具体实现方法。

Abstract

The definition and representation of planning problems is at the heart of AI planning research. A key part is the representation of action models. Decades of advances improving declarative action model representations resulted in numerous theoretical advances, and capable, working, dom

ai planning action models offline modeling online modeling action cost estimators

发现论文，激发创造

基于模型的离线规划

提出一种基于模型的离线学习算法 (MBOP)，其可以通过规划直接控制系统。该算法在一系列机器人任务中表现出良好性能，并能够创建零 - shot 目标条件策略。

Aug, 2020

基于模型的脱机 Planning 与轨迹剪枝

本研究提出了一个新型的轻量级基于模型的离线规划框架 MOPP，通过通过学习数据中的行为策略鼓励更激进的轨迹回放，并修剪出问题轨迹，以避免潜在的超出分布样本，相对于现有模型的离线规划和 RL 方法表现更具有竞争性。

May, 2021

由实际到逻辑再到实践：从原始数据中创造符号词汇、行动和模型的规划方法

本文介绍了一种自主学习的方法，通过无标注的高维真实值机器人轨迹，自动学习抽象状态和动作的可推广的基于逻辑的关系表示，形成了自动发明的类似 PDDL 的领域模型。通过确定性设置的实证结果表明，仅凭少量机器人轨迹就可以学习到强大的抽象表示，所学的关系表示包括但超越了高级动作的经典直观概念，并且学习的模型使得规划算法能够扩展到以前超出手工构思抽象的任务范围。

Feb, 2024

通过情境建模和基于模型的策略学习在教学视频中进行程序规划

本文提出了一种新的过程规划公式，通过贝叶斯推论和基于模型的模仿学习，建模人类行为，从而在实际的指导视频中实现了它，证明了我们的方法可以实现达到指定目标的最先进性能的同时，学习到的上下文信息以潜在空间的形式表现出有趣的特征。

Oct, 2021

从状态空间结构学习规划的一阶符号表示

通过将规划器使用的一阶符号表示从编码状态空间结构的非符号输入中学习，我们解决了图像与符号之间的鸿沟，这意味着推断一个完整的一阶表示（即一般的动作模式、关系符号和对象）来解释所观察到的状态空间结构。

Sep, 2019

在经典规划方案中实现组合性编码

本文采用范畴论的数学理论和图形语法对 PDDL 中的领域、问题和计划进行模型建模，通过将行动视为不同字面意义之间的映射，以描述动作之间的依赖性和选定的方案，并提供了一种图形语法和线性记法，以便推断计划的每一步所使用的替代方案。

Jul, 2021

自动计划的重构技术：一项系统性综述

该论文对经典规划的重组技术的大量研究进行了系统综述，旨在提供该领域的整体视图，并促进未来的研究。作为一个有形的结果，我们提供了现有技术分类的定性比较，这可以帮助研究人员获得它们的优点和缺点的概述。

Jan, 2023

利用自然语言指导学习自适应规划表示

Ada 使用语言模型从任务通用的背景知识中自动构建特定任务的规划表示，通过与其他使用语言模型进行顺序决策的方法相比，在两个基准任务上表现出更准确的计划和更好的任务复杂性泛化能力。

Dec, 2023

学习基于一阶符号计划的基础表达

本研究提出了一种新的学习规划模型的方法，其既有组合方法学习清晰的动作模板，又能够从图像空间中产生动作模板，这是结合前两种方法的优势的一步。

Apr, 2022

计划中基于文本的动作模型获取

本论文提出了一种利用自然语言处理和约束满足技术从文本描述中学习行动模型的方法，通过构建一种新型语言模型提取计划轨迹并建立一组约束条件来生成行动模型。实验结果表明这种方法是有效而高效的。

Feb, 2022