- 学习基础模型以解决路径规划问题的启发函数
通过深度强化学习训练启发式函数,该研究提出了一种新型基础模型,能够在不进一步微调的情况下适应各种新领域,从而在复杂路径规划问题中为人工智能驱动的解决方案建立了新的效率和适应性标准。
- 优化规划启发式算法,以排序而非估算目标开销
本论文重新审视了启发式函数在规划中的模仿学习中的必要和充分条件,并针对给定的前向搜索算法的变体提出了一族基于排名的损失函数。另外,从学习理论的角度讨论了为什么优化成本 - 目标 h * 是不必要困难的。实验比较在多样化的问题集上明确地支持了 - 使用功能化面向对象网络进行知识检索
本文描述了一种用于机器人任务的知识表示模型 FOON,定义了其结构和主要组件,并介绍了创建通用 FOON 数据集的过程。同时,讨论了在 FOON 中使用的各种搜索算法和启发式函数以及它们的效果。
- 经典规划中学习启发式函数的样本生成策略理解
本研究旨在通过使用样本学习启发式函数,研究影响学习启发式函数性能的样本生成策略,并提出实用策略,以改善所得到的神经网络启发式函数的质量。
- A * 学习启发式方法的可微损失函数
本文讨论用于 A * 算法启发函数的深度神经网络的优化问题,提出使用 L * 损失函数可以显著提高迷宫等领域的自动化规划质量和效率。
- 从前像样本中学习启发式函数以进行古典规划
本文提出了一种基于回归的监督学习算法 (RSL),用于学习每个实例的神经网络定义的启发式函数,以解决经典计划问题,并证明了它在覆盖率和训练时间方面优于以前的计划启发式功能。
- IJCAI计算通用规划的启发式搜索程序
本文针对广义规划领域,在引入启发式搜索方法的前提下,提出首个本地启发式搜索方法,定义基于程序的解空间,以实现不同实例规划和不同实例规划大小的独立运行,同时定义 BFGP 算法进行最佳优先搜索,并由不同评估和启发式功能作为指导。
- 完全可观察非确定规划的迭代深度优先搜索
本文开发了一种新的迭代深度优先搜索算法,专为 Fully Observable Non-Deterministic (FOND) planning 设计,在解决 FOND planning 任务和生成强周期策略方面表现出鲁棒性和效率。
- AAAI在计划空间规划中学习和调优元启发式算法
本文介绍了两种方法来改善 POCL 规划器的性能,包括使用有监督学习算法优化 POCL 规划器和使用在线误差最小化方法进一步提高模型的信息量。实验证明,这些学习方法可扩展规划器的性能,特别是在处理较大问题时更为有效。
- 计划基准中局部搜索拓扑的 ' 忽略删除列表 ' 是如何起作用的
该研究探讨了规划算法中启发式函数(heuristic functions)的作用,以及不同领域结构和搜索性能之间的关系,通过使用 NP 难问题 h + 函数(an idealized heuristic function)和 30 个广泛使