基于可信度的潜在空间经典规划启发式

Jun, 2023

基于可信度的潜在空间经典规划启发式

Plausibility-Based Heuristics for Latent Space Classical Planning

Yuta Takata, Alex Fukunaga

TL;DRLatPlan 通过无标签图像数据学习领域无关的经典计划器模型，提出了基于可信性的启发式方法 PBH，可以显著提高图像拼图和汉诺塔领域的有效解决方案数量。

Abstract

Recent work on latplan has shown that it is possible to learn models for domain-independent classical planners from unlabeled image data. Although PDDL models acquired by →

latplan domain-independent classical planners pddl models plausibility-based heuristics best-first search

发现论文，激发创造

深度潜空间中的古典规划：跨越子符号和符号边界

本文介绍了一种使用深度学习与经典规划相结合的无监督架构 LatPlan，通过提供一组图像对作为训练输入和一对初始和目标状态图像作为规划输入，可以使规划过程在符号潜在空间中找到计划并返回可视化的计划执行。

Apr, 2017

使用神经网络学习特定搜索空间启发式算法

建议并评估了一种系统，该系统学习了一种用于基于正向搜索的满足经典规划的神经网络启发式函数。我们的系统从头开始学习目标估计器，并生成训练数据。通过反向回归搜索或通过反向搜索从给定或猜测的目标状态生成培训数据。

Jun, 2023

启发式规划的定理证明

本研究介绍了一种利用启发式算法解决定理证明和计划制定问题的方法，并将其应用于 situation calculus 中。该方法通过使用 A * 搜索算法排列一系列情境，并利用删除松弛法控制启发式规划器，获得较短的计划方案，并探索较少的状态。实验表明，该方法可以应用于较大规模的问题。

Mar, 2023

信念空间搜索的计划图启发式方法

提供了一种基于状态距离测量的置信状态距离估计框架，利用聚合状态距离度量的方法来定义置信状态之间的距离，实现了一些技术来聚合状态距离及其关联属性，提出了几种规划图启发式方法的广义形式，利用 BDD 来计算最有效的技巧，这些启发式方法在两个规划器上得到了有效应用。

Mar, 2011

学习领域无关的触发条件与提升计划

我们提出了三种新颖的图表示方法，用于使用图神经网络（GNN）指导搜索，以学习与领域无关的启发式。我们还提供了对我们模型表达能力的理论分析，证明其中一些比 STRIPS-HGN（唯一的其他现有的学习领域无关启发式模型）更强大。我们的实验表明，我们的启发式算法可以广泛适用于训练集之外的更大问题，并远远超过 STRIPS-HGN 的启发式算法。

Dec, 2023

PcLast: 发现可规划的连续潜在状态

我们学习到一种能够关联可达状态的表示方法，通过学习多步逆动力学获得一个潜在表示，并将其转换为在 l2 空间中关联可达状态，这种方法可以显著提高采样效率，并实现层次化规划。

Nov, 2023

回归传统：用传统机器学习学习可靠的启发式方法

当前的学习规划方法在几个领域中仍无法与经典规划器达到竞争力的性能，并具有较差的综合性能。本研究提出了一种构建新颖的图表示的提升规划任务，并使用 WL 算法从中生成特征的方法。这些特征与传统机器学习方法结合使用，其参数数量比最先进的深度学习规划模型少 2 个数量级，训练速度快 3 个数量级。我们的新方法 WL-GOOSE 可可靠地从头开始学习启发式，并在公平竞争环境中优于 $h^{ext {FF}}$ 启发式。在 10 个领域中 WL-GOOSE 在覆盖率上优于或与 LAMA 持平，在计划质量上优于 LAMA 的 4 个领域。WL-GOOSE 是第一个在学习规划模型中取得这些成就的模型。此外，我们还研究了我们的新型 WL 特征生成方法、先前的理论化学习架构和用于规划的描述逻辑特征之间的联系。

Mar, 2024

基于启发式搜索的通用规划：利用对象指针的新规划搜索空间

本研究提出了一种新的基于指针的 GP 解空间、评估和启发式函数，以及 BFGP 算法，为了实现 GP 的启发式搜索，避免了提前 grounding state 或 action 所带来的问题，能有效处理大型状态变量集合和大量数值域的情况。

Jan, 2023

用于最优经典计划的高维势启发式

本研究尝试寻找一种比先前方法更有效的状态空间搜索算法，并通过构造新的图形结构来实现可行性和可解性的结果。

Sep, 2019

思路规划：以启发式引导的大型语言模型问题解决方案

在本研究中，我们使用基于规划的方法结合部分可观察马尔可夫决策过程（POMDPs）来解决多步骤的问题，并通过 POMCP 在线求解器在 24 点游戏任务上展现出了 89.4% 的优越成功率，同时也提供了比之前使用的固定树搜索更好的任意时间性能。

Apr, 2024