信念空间搜索的计划图启发式方法
LatPlan 通过无标签图像数据学习领域无关的经典计划器模型,提出了基于可信性的启发式方法 PBH,可以显著提高图像拼图和汉诺塔领域的有效解决方案数量。
Jun, 2023
本论文重新审视了启发式函数在规划中的模仿学习中的必要和充分条件,并针对给定的前向搜索算法的变体提出了一族基于排名的损失函数。另外,从学习理论的角度讨论了为什么优化成本 - 目标 h * 是不必要困难的。实验比较在多样化的问题集上明确地支持了得出的理论。
Oct, 2023
本文扩展了一种在规划中处理基于感知的信念跟踪的算法,该算法在可自定义的时间和空间范围内找出最可能的信念。此外,我们还引入了一种快速而有效的近似方法,该方法在时间和空间复杂度上都是指数级的,使算法可在高度宽但低因果宽度的领域中展现出最先进的实时性能。
Sep, 2019
在存在多模态假设和环境感知混淆情况下,本文提出了一种基于置信空间规划的高效数据关联计算方法,并证明了提出方法的正确性与可行性
Feb, 2022
本研究提出了一种新的基于指针的 GP 解空间、评估和启发式函数,以及 BFGP 算法,为了实现 GP 的启发式搜索,避免了提前 grounding state 或 action 所带来的问题,能有效处理大型状态变量集合和大量数值域的情况。
Jan, 2023
本文运用网络优化和统计抽样技术,克服了计算 Kantorovich 度量在实践中的成本问题,提出了一系列用于 MDP 状态聚合的距离函数,这些函数在时间和空间复杂度以及聚合质量之间存在不同的权衡,并对这些权衡进行了实证评估。
Jun, 2012
建议并评估了一种系统,该系统学习了一种用于基于正向搜索的满足经典规划的神经网络启发式函数。我们的系统从头开始学习目标估计器,并生成训练数据。通过反向回归搜索或通过反向搜索从给定或猜测的目标状态生成培训数据。
Jun, 2023
研究了基于信念空间规划的在线决策问题,在信息收集等场景下,介绍了一种自适应的方法来寻求最大可行回报,应用这种方法可以在保证准确率的前提下显著加速在线决策过程,并进行了大量现实模拟来验证此方法的优越性。
Feb, 2023