使用神经网络学习特定搜索空间启发式算法

Jun, 2023

使用神经网络学习特定搜索空间启发式算法

Learning Search-Space Specific Heuristics Using Neural Networks

Yu Liu, Ryo Kuroiwa, Alex Fukunaga

TL;DR建议并评估了一种系统，该系统学习了一种用于基于正向搜索的满足经典规划的神经网络启发式函数。我们的系统从头开始学习目标估计器，并生成训练数据。通过反向回归搜索或通过反向搜索从给定或猜测的目标状态生成培训数据。

Abstract

We propose and evaluate a system which learns a neuralnetwork heuristic function for forward search-based, satisficing classical planning. Our system learns distance-to-goal estimators from scratch, given a single pddl

neural network classical planning distance-to-goal estimator pddl training heuristics

发现论文，激发创造

经典规划中学习启发式函数的样本生成策略理解

本研究旨在通过使用样本学习启发式函数，研究影响学习启发式函数性能的样本生成策略，并提出实用策略，以改善所得到的神经网络启发式函数的质量。

Nov, 2022

从前像样本中学习启发式函数以进行古典规划

本文提出了一种基于回归的监督学习算法 (RSL)，用于学习每个实例的神经网络定义的启发式函数，以解决经典计划问题，并证明了它在覆盖率和训练时间方面优于以前的计划启发式功能。

Jul, 2022

学习广义关系启发式网络进行模型无关规划

利用深度神经网络学习适用于不同对象及数量的通用启发式方法，以解决当前计算复杂性问题所依赖的手工编码符号动作模型和启发式函数生成器效率不高的问题。实证评估表明，由此方法计算的通用启发函数可轻松应用于不同对象、数量显著大于训练数据的问题。

Jul, 2020

朝向学习领域独立规划启发式方法

利用机器学习获取领域无关的启发式函数以提高自动规划在不同领域系统中的实际应用。

Jul, 2017

优化规划启发式算法，以排序而非估算目标开销

本论文重新审视了启发式函数在规划中的模仿学习中的必要和充分条件，并针对给定的前向搜索算法的变体提出了一族基于排名的损失函数。另外，从学习理论的角度讨论了为什么优化成本 - 目标 h * 是不必要困难的。实验比较在多样化的问题集上明确地支持了得出的理论。

Oct, 2023

基于可信度的潜在空间经典规划启发式

LatPlan 通过无标签图像数据学习领域无关的经典计划器模型，提出了基于可信性的启发式方法 PBH，可以显著提高图像拼图和汉诺塔领域的有效解决方案数量。

Jun, 2023

学习排名以合成规划启发式方法

研究领域特定规划的学习启发式，通过学习排名问题，引入了新的方法来计算捕获近似计划中的时间交互的特征。在最近的国际规划竞赛问题上进行的实验表明，RankSVM 学习启发式优于原始启发式和通过普通回归学习的启发式。

Aug, 2016

用策略梯度学习经典规划策略

引入一种新的搜索框架来解决规划问题，该框架能够在解决特定规划问题时在几种前向搜索方法之间交替使用，使用可训练的随机策略来选择搜索方法，进而优化搜索策略，实验结果表明该框架优于传统的最佳优先搜索和均匀策略方法。

Oct, 2018

学习基础模型以解决路径规划问题的启发函数

通过深度强化学习训练启发式函数，该研究提出了一种新型基础模型，能够在不进一步微调的情况下适应各种新领域，从而在复杂路径规划问题中为人工智能驱动的解决方案建立了新的效率和适应性标准。

Jun, 2024

学习使用不确定拓扑地图进行规划

本文采用一种数据驱动的策略和基于图像的规划，应用于 3D 环境中的导航系统，通过机器学习方法实现了图像哈希表上的最短路径规划，比传统符号算法更优秀。

Jul, 2020