在存在多模态假设和环境感知混淆情况下,本文提出了一种基于置信空间规划的高效数据关联计算方法,并证明了提出方法的正确性与可行性
Feb, 2022
针对部分可观测的马尔科夫决策过程,该论文提出了一种基于置信混合的规划算法来解决完全观测数据联合假设的限制,同时引入一种基于修剪的方法来解决数据联接不确定性,以在计算效率和性能之间建立折衷。
Mar, 2023
研究了基于信念空间规划的在线决策问题,在信息收集等场景下,介绍了一种自适应的方法来寻求最大可行回报,应用这种方法可以在保证准确率的前提下显著加速在线决策过程,并进行了大量现实模拟来验证此方法的优越性。
Feb, 2023
提供了一种基于状态距离测量的置信状态距离估计框架,利用聚合状态距离度量的方法来定义置信状态之间的距离,实现了一些技术来聚合状态距离及其关联属性,提出了几种规划图启发式方法的广义形式,利用 BDD 来计算最有效的技巧,这些启发式方法在两个规划器上得到了有效应用。
Mar, 2011
该研究旨在使用奖励函数来有效地做出明智的决策,通过提出抽象观测模型来降低计算成本并推导出期望信息论奖励函数的界限以及价值函数的界限,同时,提出了一种用于改善聚合方法的方法,实现了相同动作选择的计算时间减少。
Jan, 2022
本文提出了一个在线计划和执行系统,使用混合置信状态空间进行确定性代价敏感计划来选择成功概率高的观察行动和连续控制行动,以解决部分可观察问题,并在模拟和真实世界的厨房中展示了高效的解决方案。
Nov, 2019
本文提出一种计算信息论预期奖励的方法,运用信息量 (mutual information) 进行降维,开发出一个 Sequential Monte Carlo (SMC) 估计器,以避免未来信仰表面的重建,并将此方法应用于信息规划优化问题,最后在活动 SLAM 问题的模拟中评估该方法。
Sep, 2022
本文扩展了一种在规划中处理基于感知的信念跟踪的算法,该算法在可自定义的时间和空间范围内找出最可能的信念。此外,我们还引入了一种快速而有效的近似方法,该方法在时间和空间复杂度上都是指数级的,使算法可在高度宽但低因果宽度的领域中展现出最先进的实时性能。
Sep, 2019
该论文介绍了一种基于模型的方法,利用概率推理和深度生成模型的方法,解决在空间环境中的定位、绘图、导航或自主探索等问题,并能够灵活地从数据中学习。该方法在两个不同的模拟环境中表现出了与专业最新方法相当的性能。
May, 2018
该论文将随机规划分解成两个维度:正向和反向推断以及置信传播法和均值场变分推断等不同方法,进而提出折叠状态变分推断 (CSVI) 算法,并通过实验比较发现其与正向置信传播法是最佳的随机规划方法之一。
Mar, 2022