本研究提出了一种新的基于指针的 GP 解空间、评估和启发式函数,以及 BFGP 算法,为了实现 GP 的启发式搜索,避免了提前 grounding state 或 action 所带来的问题,能有效处理大型状态变量集合和大量数值域的情况。
Jan, 2023
本文提出一种新的方法,在规划中利用排序约束来指导搜索,使用工具扩展 Koehler 和 Hoffmann 的合理顺序,找到 Landmarks 并将规划任务分解为多个子任务从而提高运行时间性能。
Jun, 2011
本文针对广义规划领域,在引入启发式搜索方法的前提下,提出首个本地启发式搜索方法,定义基于程序的解空间,以实现不同实例规划和不同实例规划大小的独立运行,同时定义 BFGP 算法进行最佳优先搜索,并由不同评估和启发式功能作为指导。
May, 2022
探讨了使用多种不同的地标提取算法在目标和计划识别上的影响和效果,发现提取更多的地标并不一定能提高目标识别的精度和减小误差。
May, 2020
介绍了基于规划程序的行动新颖性排名概念以及新颖性优化的 GP 算法,采用基于最佳优先搜索 BFS(v) 和其渐进变体 PGP(v)的方法,引入来自行动方案的提高可行性行动,并提出了新的评估函数和结构化程序限制,以扩展搜索范围。经实验证明,新算法 BFS(v)和 PGP(v)在标准通用计划基准测试中优于现有算法。
Jul, 2023
通过定义一种新的 “相关性评分” 来帮助识别出在大多数但并非所有计划中出现的事实或行动,我们研究了对地标概念的扩展。我们描述了一种计算此相关性评分并将其用作计划搜索中的启发式的方法。通过使用基准计划问题实验比较我们方法与现有的基于地标启发式计划方法的性能。尽管基于地标的启发式在具有明确定义地标的问题上的性能更好,但我们的方法显著提高了缺乏重要地标的问题的性能。
Mar, 2024
本文介绍了 HIerarchical reinforcement learning Guided by Landmarks (HIGL) 框架,该框架通过引导探索性的 Landmarks 来训练具有减少动作空间的高层级策略,实现高效探索。实验结果表明,该框架在控制任务中表现优异。
Oct, 2021
本文提出了一种在线目标识别混合方法,结合了符号规划和数据驱动方法, 并在真实世界的烹饪场景中进行了评估,研究结果表明,与现有技术相比该方法在计算时间上更高效,同时也提高了目标识别的性能。另外,论文也证明了该方法适用于真实世界的场景。
本文研究基于规划地标的目标识别方法,经实验证明去除初始状态地标可以提高目标识别的性能和计算效率。
Jun, 2023
LAMA 是一个基于启发式正向搜索的经典规划系统,利用里程碑派生的伪启发式是其核心特征,结合具备成本敏感性的两种启发式可以面对具有非均匀成本的动作,迭代加权 A * 搜索可持续提高搜索质量并表现出与使用里程碑有协同效应;LAMA 在国际计划竞赛 2008 的顺序满足赛道表现最佳,但它的启发式评估中融入动作成本并不具优势,导致在某些情况下,不考虑成本的搜索方法更加成功,这引出了今后应如何更有效地处理行动成本的问题。
Jan, 2014