规划中的有序地标
通过定义一种新的 “相关性评分” 来帮助识别出在大多数但并非所有计划中出现的事实或行动,我们研究了对地标概念的扩展。我们描述了一种计算此相关性评分并将其用作计划搜索中的启发式的方法。通过使用基准计划问题实验比较我们方法与现有的基于地标启发式计划方法的性能。尽管基于地标的启发式在具有明确定义地标的问题上的性能更好,但我们的方法显著提高了缺乏重要地标的问题的性能。
Mar, 2024
本文提出了一种在线目标识别混合方法,结合了符号规划和数据驱动方法, 并在真实世界的烹饪场景中进行了评估,研究结果表明,与现有技术相比该方法在计算时间上更高效,同时也提高了目标识别的性能。另外,论文也证明了该方法适用于真实世界的场景。
Jan, 2023
LAMA 是一个基于启发式正向搜索的经典规划系统,利用里程碑派生的伪启发式是其核心特征,结合具备成本敏感性的两种启发式可以面对具有非均匀成本的动作,迭代加权 A * 搜索可持续提高搜索质量并表现出与使用里程碑有协同效应;LAMA 在国际计划竞赛 2008 的顺序满足赛道表现最佳,但它的启发式评估中融入动作成本并不具优势,导致在某些情况下,不考虑成本的搜索方法更加成功,这引出了今后应如何更有效地处理行动成本的问题。
Jan, 2014
本文介绍了 HIerarchical reinforcement learning Guided by Landmarks (HIGL) 框架,该框架通过引导探索性的 Landmarks 来训练具有减少动作空间的高层级策略,实现高效探索。实验结果表明,该框架在控制任务中表现优异。
Oct, 2021
该论文提出 L3P 算法,使用稀疏的多步转换学习基于图结构的世界模型并生成 Q - 函数,其在高维连续控制任务上具有优越的性能,是深度强化学习中可扩展规划的重要进展。
Nov, 2020
提出了一种视觉导航的公式,该公式将基于地图的空间推理和路径规划与基于地标的稳健计划执行融合,该公式基于数据学习,能够高效地导航在新颖环境中,针对模拟现实世界环境进行了测试并报告了竞争基线方法的性能提高。
Dec, 2017