规划中的有序地标

Jun, 2011

Ordered Landmarks in Planning

J. Hoffmann, J. Porteous, L. Sebastia

TL;DR本文提出一种新的方法，在规划中利用排序约束来指导搜索，使用工具扩展 Koehler 和 Hoffmann 的合理顺序，找到 Landmarks 并将规划任务分解为多个子任务从而提高运行时间性能。

Abstract

Many known planning tasks have inherent constraints concerning the best order in which to achieve the goals. A number of research efforts have been made to detect such constraints and to use them for guiding search, in the hope of speeding up the →

planning ordering constraints landmarks sub-tasks runtime performance improvements

发现论文，激发创造

相关分数：规划中的地标式启发式

通过定义一种新的 “相关性评分” 来帮助识别出在大多数但并非所有计划中出现的事实或行动，我们研究了对地标概念的扩展。我们描述了一种计算此相关性评分并将其用作计划搜索中的启发式的方法。通过使用基准计划问题实验比较我们方法与现有的基于地标启发式计划方法的性能。尽管基于地标的启发式在具有明确定义地标的问题上的性能更好，但我们的方法显著提高了缺乏重要地标的问题的性能。

Mar, 2024

利用路径标志将广义规划扩展为启发式搜索

本文提出了一种用于广义规划的地标计数启发式算法，可以考虑规划实例中未显式表示的子目标信息，进一步提升启发式搜索的效率和实现。

May, 2022

基于地标的目标识别规划再探讨：使用初始状态地标是否有意义？

本文研究基于规划地标的目标识别方法，经实验证明去除初始状态地标可以提高目标识别的性能和计算效率。

Jun, 2023

利用规划里程碑进行混合在线目标识别

本文提出了一种在线目标识别混合方法，结合了符号规划和数据驱动方法，并在真实世界的烹饪场景中进行了评估，研究结果表明，与现有技术相比该方法在计算时间上更高效，同时也提高了目标识别的性能。另外，论文也证明了该方法适用于真实世界的场景。

Jan, 2023

地标提取算法对基于地标的目标识别效果的评估

探讨了使用多种不同的地标提取算法在目标和计划识别上的影响和效果，发现提取更多的地标并不一定能提高目标识别的精度和减小误差。

May, 2020

LAMA Planner: 以标志物为导向的成本感知规划算法

LAMA 是一个基于启发式正向搜索的经典规划系统，利用里程碑派生的伪启发式是其核心特征，结合具备成本敏感性的两种启发式可以面对具有非均匀成本的动作，迭代加权 A * 搜索可持续提高搜索质量并表现出与使用里程碑有协同效应；LAMA 在国际计划竞赛 2008 的顺序满足赛道表现最佳，但它的启发式评估中融入动作成本并不具优势，导致在某些情况下，不考虑成本的搜索方法更加成功，这引出了今后应如何更有效地处理行动成本的问题。

Jan, 2014

基于路标引导的分层强化学习子目标生成

本文介绍了 HIerarchical reinforcement learning Guided by Landmarks (HIGL) 框架，该框架通过引导探索性的 Landmarks 来训练具有减少动作空间的高层级策略，实现高效探索。实验结果表明，该框架在控制任务中表现优异。

Oct, 2021

将世界模型视为图：学习用于规划的潜在地标

该论文提出 L3P 算法，使用稀疏的多步转换学习基于图结构的世界模型并生成 Q - 函数，其在高维连续控制任务上具有优越的性能，是深度强化学习中可扩展规划的重要进展。

Nov, 2020

统一地图和基于地标的视觉导航表示

提出了一种视觉导航的公式，该公式将基于地图的空间推理和路径规划与基于地标的稳健计划执行融合，该公式基于数据学习，能够高效地导航在新颖环境中，针对模拟现实世界环境进行了测试并报告了竞争基线方法的性能提高。

Dec, 2017

基于地标的主动探索与稳定底层策略学习

本文介绍了一种基于目标状态和价值函数的探索策略，可以有效解决高层次策略的行动空间过大和低级别策略的动态变化导致高层次政策的不稳定性问题。

Jun, 2023