基于可信度的潜在空间经典规划启发式
本文介绍了一种使用深度学习与经典规划相结合的无监督架构 LatPlan,通过提供一组图像对作为训练输入和一对初始和目标状态图像作为规划输入,可以使规划过程在符号潜在空间中找到计划并返回可视化的计划执行。
Apr, 2017
建议并评估了一种系统,该系统学习了一种用于基于正向搜索的满足经典规划的神经网络启发式函数。我们的系统从头开始学习目标估计器,并生成训练数据。通过反向回归搜索或通过反向搜索从给定或猜测的目标状态生成培训数据。
Jun, 2023
本研究介绍了一种利用启发式算法解决定理证明和计划制定问题的方法,并将其应用于 situation calculus 中。该方法通过使用 A * 搜索算法排列一系列情境,并利用删除松弛法控制启发式规划器,获得较短的计划方案,并探索较少的状态。实验表明,该方法可以应用于较大规模的问题。
Mar, 2023
提供了一种基于状态距离测量的置信状态距离估计框架,利用聚合状态距离度量的方法来定义置信状态之间的距离,实现了一些技术来聚合状态距离及其关联属性,提出了几种规划图启发式方法的广义形式,利用 BDD 来计算最有效的技巧,这些启发式方法在两个规划器上得到了有效应用。
Mar, 2011
我们提出了三种新颖的图表示方法,用于使用图神经网络(GNN)指导搜索,以学习与领域无关的启发式。我们还提供了对我们模型表达能力的理论分析,证明其中一些比 STRIPS-HGN(唯一的其他现有的学习领域无关启发式模型)更强大。我们的实验表明,我们的启发式算法可以广泛适用于训练集之外的更大问题,并远远超过 STRIPS-HGN 的启发式算法。
Dec, 2023
我们学习到一种能够关联可达状态的表示方法,通过学习多步逆动力学获得一个潜在表示,并将其转换为在 l2 空间中关联可达状态,这种方法可以显著提高采样效率,并实现层次化规划。
Nov, 2023
当前的学习规划方法在几个领域中仍无法与经典规划器达到竞争力的性能,并具有较差的综合性能。本研究提出了一种构建新颖的图表示的提升规划任务,并使用 WL 算法从中生成特征的方法。这些特征与传统机器学习方法结合使用,其参数数量比最先进的深度学习规划模型少 2 个数量级,训练速度快 3 个数量级。我们的新方法 WL-GOOSE 可可靠地从头开始学习启发式,并在公平竞争环境中优于 $h^{ext {FF}}$ 启发式。在 10 个领域中 WL-GOOSE 在覆盖率上优于或与 LAMA 持平,在计划质量上优于 LAMA 的 4 个领域。WL-GOOSE 是第一个在学习规划模型中取得这些成就的模型。此外,我们还研究了我们的新型 WL 特征生成方法、先前的理论化学习架构和用于规划的描述逻辑特征之间的联系。
Mar, 2024
本研究提出了一种新的基于指针的 GP 解空间、评估和启发式函数,以及 BFGP 算法,为了实现 GP 的启发式搜索,避免了提前 grounding state 或 action 所带来的问题,能有效处理大型状态变量集合和大量数值域的情况。
Jan, 2023
在本研究中,我们使用基于规划的方法结合部分可观察马尔可夫决策过程(POMDPs)来解决多步骤的问题,并通过 POMCP 在线求解器在 24 点游戏任务上展现出了 89.4% 的优越成功率,同时也提供了比之前使用的固定树搜索更好的任意时间性能。
Apr, 2024