优化规划启发式算法，以排序而非估算目标开销

Oct, 2023

优化规划启发式算法，以排序而非估算目标开销

Optimize Planning Heuristics to Rank, not to Estimate Cost-to-Goal

Leah Chrestien, Tomás Pevný, Stefan Edelkamp, Antonín Komenda

TL;DR本论文重新审视了启发式函数在规划中的模仿学习中的必要和充分条件，并针对给定的前向搜索算法的变体提出了一族基于排名的损失函数。另外，从学习理论的角度讨论了为什么优化成本 - 目标 h * 是不必要困难的。实验比较在多样化的问题集上明确地支持了得出的理论。

Abstract

In imitation learning for planning, parameters of heuristic functions are optimized against a set of solved problem instances. This work revisits the necessary and sufficient conditions of strictly optimally effi

imitation learning heuristic functions forward search algorithms loss functions learning theory

发现论文，激发创造

学习排名以合成规划启发式方法

研究领域特定规划的学习启发式，通过学习排名问题，引入了新的方法来计算捕获近似计划中的时间交互的特征。在最近的国际规划竞赛问题上进行的实验表明，RankSVM 学习启发式优于原始启发式和通过普通回归学习的启发式。

Aug, 2016

经典规划中学习启发式函数的样本生成策略理解

本研究旨在通过使用样本学习启发式函数，研究影响学习启发式函数性能的样本生成策略，并提出实用策略，以改善所得到的神经网络启发式函数的质量。

Nov, 2022

使用神经网络学习特定搜索空间启发式算法

建议并评估了一种系统，该系统学习了一种用于基于正向搜索的满足经典规划的神经网络启发式函数。我们的系统从头开始学习目标估计器，并生成训练数据。通过反向回归搜索或通过反向搜索从给定或猜测的目标状态生成培训数据。

Jun, 2023

学习 A * 启发式算法

本文利用神经演算法推导出高效的启发式路径搜索算法，结合 Dijkstra 算法和 A * 算法中的一致的启发函数，并将其推广应用于图形中的路径搜索问题，结果表明相较于 Dijkstra 算法，应用基于学习到的 A * 算法中的启发函数的改进搜索在无损质量的情况下，实现了大幅的速度提升。

Apr, 2022

通过模仿学习启发式搜索

使用 SaIL 特有的算法，训练启发式策略来遍历搜索树中的节点，以减少搜索次数。实验证明 SaIL 算法在实时规划环境中优于现有算法，这为学习体现 ' 快速找到可行解并随时间增量调整 ' 的启发式方法铺平了道路。

Jul, 2017

学习广义关系启发式网络进行模型无关规划

利用深度神经网络学习适用于不同对象及数量的通用启发式方法，以解决当前计算复杂性问题所依赖的手工编码符号动作模型和启发式函数生成器效率不高的问题。实证评估表明，由此方法计算的通用启发函数可轻松应用于不同对象、数量显著大于训练数据的问题。

Jul, 2020

A * 学习启发式方法的可微损失函数

本文讨论用于 A * 算法启发函数的深度神经网络的优化问题，提出使用 L * 损失函数可以显著提高迷宫等领域的自动化规划质量和效率。

Sep, 2022

朝向学习领域独立规划启发式方法

利用机器学习获取领域无关的启发式函数以提高自动规划在不同领域系统中的实际应用。

Jul, 2017

信念空间搜索的计划图启发式方法

提供了一种基于状态距离测量的置信状态距离估计框架，利用聚合状态距离度量的方法来定义置信状态之间的距离，实现了一些技术来聚合状态距离及其关联属性，提出了几种规划图启发式方法的广义形式，利用 BDD 来计算最有效的技巧，这些启发式方法在两个规划器上得到了有效应用。

Mar, 2011

基于启发式搜索的通用规划：利用对象指针的新规划搜索空间

本研究提出了一种新的基于指针的 GP 解空间、评估和启发式函数，以及 BFGP 算法，为了实现 GP 的启发式搜索，避免了提前 grounding state 或 action 所带来的问题，能有效处理大型状态变量集合和大量数值域的情况。

Jan, 2023