SLOPE: 带学习的最优剪枝扩展搜索
介绍并分析了两种无需参数的线性存储器树搜索算法,理论证明在树搜索空间中,不会比 A * 算法更多地扩展节点,并且实验结果支持理论,证明了我们算法的实用性和稳健性。
Jun, 2019
使用 SaIL 特有的算法,训练启发式策略来遍历搜索树中的节点,以减少搜索次数。实验证明 SaIL 算法在实时规划环境中优于现有算法,这为学习体现 ' 快速找到可行解并随时间增量调整 ' 的启发式方法铺平了道路。
Jul, 2017
本论文重新审视了启发式函数在规划中的模仿学习中的必要和充分条件,并针对给定的前向搜索算法的变体提出了一族基于排名的损失函数。另外,从学习理论的角度讨论了为什么优化成本 - 目标 h * 是不必要困难的。实验比较在多样化的问题集上明确地支持了得出的理论。
Oct, 2023
本论文提出一种高效有效的在线搜索算法 —— 探索性策略梯度搜索(ExPoSe),结合明确定义的探索机制,并在在线搜索过程中直接更新搜索策略参数,利用状态之间的信息共享,评估其在各种决策制定问题中的性能表现(包括 Atari 游戏、Sokoban 和稀疏图中的 Hamilton 圈搜索),结果表明 ExPoSe 在所有领域中始终优于其他流行的在线搜索算法。
Feb, 2022
PHIL (Path Heuristic with Imitation Learning) is a neural architecture and training algorithm that uses imitation learning and graph representation learning to discover graph search and navigation heuristics from data, reducing the number of explored nodes by 58.5% compared to state-of-the-art methods on benchmark datasets and allowing for fast planning in time-critical robotics domains.
Dec, 2022
本文提出了一种基于机器学习的启发式计划搜索控制方法,通过学习搜索启发式计划的控制策略,实现了减少计算节点评估的目的,并通过两种方法(使用分类器作为行动策略和将分类器应用于生成前瞻状态)有效提高搜索效率,解决了现有启发式计划算法在可伸缩性方面的不足。
Jan, 2014
智能自主路径规划的关键是提高行星探测器的探索效率。本文提出了一种基于学习的方法,用于在高程地图中快速搜索最优路径,称为 NNPP 模型。该模型通过大量预注释的最优路径示范中学习起点和目标位置的语义信息以及地图表示,并生成每个像素的概率分布,表示其属于地图上最优路径的可能性。通过计算从 DEM 中获得的坡度、粗糙度和高度差来计算每个网格单元的遍历成本。随后,使用高斯分布对起点和目标位置进行编码,并分析不同位置编码参数对模型性能的影响。在训练后,NNPP 模型能够在新颖的地图上进行路径规划。实验证明,NNPP 模型生成的导航场能够在相同硬件条件下显著缩短寻找最优路径的时间,并且 NNPP 的优势随着地图规模的增加而增加。
Aug, 2023
建议并评估了一种系统,该系统学习了一种用于基于正向搜索的满足经典规划的神经网络启发式函数。我们的系统从头开始学习目标估计器,并生成训练数据。通过反向回归搜索或通过反向搜索从给定或猜测的目标状态生成培训数据。
Jun, 2023
我们提出了一种元路径规划算法,名为神经探索利用树(NEXT),用于从先前经验中学习以解决高维连续状态和动作空间中的新路径规划问题。与 RRT 等更经典的基于采样的方法相比,我们的方法在高维度中实现了更好的样本效率,并且可以从规划类似环境的先前经验中受益。具体而言,NEXT 利用一种新颖的神经结构,可以从问题结构中学习有希望的搜索方向。然后将学习到的先验知识集成到一种 UCB 类型的算法中,以在线实现在解决新问题时探索与开发之间的平衡。我们进行了详尽的实验,表明 NEXT 可以实现更简洁的搜索树来解决新的规划问题,并且在几个基准测试中显着优于现有方法。
Feb, 2019