- 使用动态算法配置学习启发式选择
通过动态算法配置和强化学习,可以使用多个启发式方法进行规划,并考虑内部搜索动态,以选择最有用的启发式方法,在一定程度上可以大幅提高启发性搜索的性能。
- CVPR后悔的智能体:借助进展估计的启发式导航
本文提出了一种基于可学习启发式搜索的视觉和语言导航任务的处理方法,通过两个模块 —— 后退决策和进度标记,取得较当前最优方法的 5%绝对改进和 8%路径长度的情况下成功率的提高。
- 蒙特卡洛树搜索发现多样模式的任意时间方法
通过 Monte Carlo 树搜索算法解决模式挖掘的多样性问题,该算法具有高效性和通用性。
- MM一种用于发现多样频繁模式的高效遗传算法
本文提出了一种利用遗传算法挖掘多样化频繁模式集的快速启发式搜索算法,采用相对编码方案和有效的双胞胎去除技术来确保搜索结果的多样性,该算法在标准基准测试中优于现有方法并能够在短时间内产生令人满意的结果。
- IJCAI多智能体规划中具有乐观影响的本地价值 --- 扩展版
本论文提出了一种影响 - 乐观上界策略,用于解决具有非因式价值函数的解离式部分可观察 MDP 的规模为数十甚至数百个代理的规划问题,并在数字上比较了不同的上界,并证明了启发式解法的优化保证,展示了该方法的多代理规划方面的潜在应用。
- LAMA Planner: 以标志物为导向的成本感知规划算法
LAMA 是一个基于启发式正向搜索的经典规划系统,利用里程碑派生的伪启发式是其核心特征,结合具备成本敏感性的两种启发式可以面对具有非均匀成本的动作,迭代加权 A * 搜索可持续提高搜索质量并表现出与使用里程碑有协同效应;LAMA 在国际计划 - 拓扑值迭代算法
提出了两种优化的 MDP 算法,分别是基于拓扑序列的拓扑值迭代算法 (TVI) 和基于聚焦拓扑值迭代算法 (FTVI),前者使用拓扑排序来备份状态,后者通过启发式搜索来消除次优行动。在多个领域的多个测试中,FTVI 在效率上都明显优于其他算 - 学习贝叶斯网络结构的等价类
使用符合等价类的搜索空间,将贪心搜索算法用于从数据中学习贝叶斯网络的性能进行了比较,发现其表现优于仅对个别贝叶斯网络结构应用贪心搜索的效果。
- 启发式搜索值迭代用于 POMDPs
本文提出了一种名为启发式搜索值迭代 (HSVI) 的新型 POMDP 规划算法,采用注意力集中搜索启发式和分段线性凸表示值函数的技术相结合,可在保证收敛与正确性的情况下提高计算速度,并在大规模问题上运用效果良好。
- 基于排序搜索:一种用于学习贝叶斯网络的简单有效算法
本篇论文介绍了一种基于有界入度的节点排序的图搜索算法,以解决根据数据学习贝叶斯网络结构的问题,实验结果表明该算法在得分和运行时间方面优于贪婪爬山法。
- 任意时刻启发式搜索
本论文将 A * 启发式搜索算法转化为逐步改进的任意时间算法,采用加权启发式搜索找到近似解,继续 weighted search 以找到更好的解并改善当前解的低下性,形成了一个能够在搜索时间和解决方案质量之间灵活权衡的任意启发式搜索算法,具 - FluCaP:用于一阶 MDPs 的启发式搜索规划器
该论文提出了一种启发式搜索算法来解决一阶马尔可夫决策过程,其方法结合了一阶状态抽象和启发式搜索,以避免对所有状态进行评估,并通过可达性引导来限制搜索。该方法在国际计划竞赛中取得了较好的成绩。
- 快速下行规划系统
Fast Downward 是一种基于启发式搜索的经典计划系统,它使用多值计划任务的另一种表示来计算其启发函数,称为因果图启发式函数,这与传统的基于忽略运算符负交互作用的 HSP 启发式函数非常不同。
- HyFlex:一个跨领域启发式搜索基准框架
HyFlex 是一个跨领域搜索方法开发的软件框架,提供通用软件接口与问题特定的算法组件,旨在为启发式搜索算法的设计提供基准,并使其更具有可适用性。