信念空间搜索的计划图启发式方法

Mar, 2011

信念空间搜索的计划图启发式方法

Planning Graph Heuristics for Belief Space Search

D. Bryce, S. Kambhampati, D. E. Smith

TL;DR提供了一种基于状态距离测量的置信状态距离估计框架，利用聚合状态距离度量的方法来定义置信状态之间的距离，实现了一些技术来聚合状态距离及其关联属性，提出了几种规划图启发式方法的广义形式，利用 BDD 来计算最有效的技巧，这些启发式方法在两个规划器上得到了有效应用。

Abstract

Some recent works in conditional planning have proposed reachability heuristics to improve planner scalability, but many lack a formal description of the properties of their →

conditional planning distance estimates heuristics belief state planning graph

发现论文，激发创造

基于可信度的潜在空间经典规划启发式

LatPlan 通过无标签图像数据学习领域无关的经典计划器模型，提出了基于可信性的启发式方法 PBH，可以显著提高图像拼图和汉诺塔领域的有效解决方案数量。

Jun, 2023

优化规划启发式算法，以排序而非估算目标开销

本论文重新审视了启发式函数在规划中的模仿学习中的必要和充分条件，并针对给定的前向搜索算法的变体提出了一族基于排名的损失函数。另外，从学习理论的角度讨论了为什么优化成本 - 目标 h * 是不必要困难的。实验比较在多样化的问题集上明确地支持了得出的理论。

Oct, 2023

预算约束下的非远见式蒸馏数据关联置信度空间规划

本文提出了一种计算效率高的算法来解决智能体在感知受扰环境中的非近视信念空间规划问题，同时分析了预算限制对推理和规划的影响。

Jul, 2022

感知规划的因果信念分解：完备性结果和实用逼近

本文扩展了一种在规划中处理基于感知的信念跟踪的算法，该算法在可自定义的时间和空间范围内找出最可能的信念。此外，我们还引入了一种快速而有效的近似方法，该方法在时间和空间复杂度上都是指数级的，使算法可在高度宽但低因果宽度的领域中展现出最先进的实时性能。

Sep, 2019

D2A-BSP: 基于蒸馏的数据关联信念空间规划实现预算限制下的性能保证

在存在多模态假设和环境感知混淆情况下，本文提出了一种基于置信空间规划的高效数据关联计算方法，并证明了提出方法的正确性与可行性

Feb, 2022

基于启发式搜索的通用规划：利用对象指针的新规划搜索空间

本研究提出了一种新的基于指针的 GP 解空间、评估和启发式函数，以及 BFGP 算法，为了实现 GP 的启发式搜索，避免了提前 grounding state 或 action 所带来的问题，能有效处理大型状态变量集合和大量数值域的情况。

Jan, 2023

学习使用不确定拓扑地图进行规划

本文采用一种数据驱动的策略和基于图像的规划，应用于 3D 环境中的导航系统，通过机器学习方法实现了图像哈希表上的最短路径规划，比传统符号算法更优秀。

Jul, 2020

马尔可夫决策过程中计算状态相似性的方法

本文运用网络优化和统计抽样技术，克服了计算 Kantorovich 度量在实践中的成本问题，提出了一系列用于 MDP 状态聚合的距离函数，这些函数在时间和空间复杂度以及聚合质量之间存在不同的权衡，并对这些权衡进行了实证评估。

Jun, 2012

使用神经网络学习特定搜索空间启发式算法

建议并评估了一种系统，该系统学习了一种用于基于正向搜索的满足经典规划的神经网络启发式函数。我们的系统从头开始学习目标估计器，并生成训练数据。通过反向回归搜索或通过反向搜索从给定或猜测的目标状态生成培训数据。

Jun, 2023

自适应概率信赖约束下的连续高维信念空间规划

研究了基于信念空间规划的在线决策问题，在信息收集等场景下，介绍了一种自适应的方法来寻求最大可行回报，应用这种方法可以在保证准确率的前提下显著加速在线决策过程，并进行了大量现实模拟来验证此方法的优越性。

Feb, 2023