基于前向状态空间搜索的启发式搜索算法是实现 FF 规划系统的主要技巧,该系统因比 HSP 系统更具优越性能而赢得了最近 AIPS-2000 规划竞赛的冠军。
Jun, 2011
本研究介绍了一种利用启发式算法解决定理证明和计划制定问题的方法,并将其应用于 situation calculus 中。该方法通过使用 A * 搜索算法排列一系列情境,并利用删除松弛法控制启发式规划器,获得较短的计划方案,并探索较少的状态。实验表明,该方法可以应用于较大规模的问题。
Mar, 2023
该论文提出了一种启发式搜索算法来解决一阶马尔可夫决策过程,其方法结合了一阶状态抽象和启发式搜索,以避免对所有状态进行评估,并通过可达性引导来限制搜索。该方法在国际计划竞赛中取得了较好的成绩。
Sep, 2011
提出了一种名为 Probabilistic-FF 的新的概率规划算法,该算法结合了 Conformant-FF 的技术和加权模型计数技术,可在具有概率部分不可观测性的问题上进行推理,并在各种概率域中显示出良好的可扩展性。
Oct, 2011
本文介绍了一种扩展了忽略删除列表的启发式搜索算法并将其应用于数值规划的方法,称为 Metric-FF,可提高数值任务的计划效率。
本文开发了一种新的迭代深度优先搜索算法,专为 Fully Observable Non-Deterministic (FOND) planning 设计,在解决 FOND planning 任务和生成强周期策略方面表现出鲁棒性和效率。
Apr, 2022
AdaSubS 是一种自适应搜索方法,通过不同距离下生成不同的子目标,利用核实机制过滤不可达的子目标,实现长短子目标策略的高效平衡,从而在三个复杂推理任务中显著优于分层规划算法 —— 推箱子游戏,魔方和 INT 不等式证明基准。
Jun, 2022
这项研究介绍了一种全观测非确定性计划(FOND)的新方法,通过引入新颖的 FOND 感知启发式技术,在 17 个领域中,比其他 FOND 计划程序在 18 个综合基准套件中显著提高了性能。
Dec, 2023
论文提出了一种基于动态规划算法框架的近似方法,针对具有快慢结构的无穷状态空间的马尔可夫决策过程,其中 “冻结” 慢状态,通过解决一组简单的有限时段 MDP 以及在一个慢时间尺度(上层 MDP)上进行价值迭代的辅助 MDP 等步骤,生成有效策略,以更少的计算代价实现了决策建模中遗漏慢状态的可行性。
Jan, 2023
建议并评估了一种系统,该系统学习了一种用于基于正向搜索的满足经典规划的神经网络启发式函数。我们的系统从头开始学习目标估计器,并生成训练数据。通过反向回归搜索或通过反向搜索从给定或猜测的目标状态生成培训数据。
Jun, 2023