预算约束下的非远见式蒸馏数据关联置信度空间规划

Jul, 2022

预算约束下的非远见式蒸馏数据关联置信度空间规划

Nonmyopic Distilled Data Association Belief Space Planning Under Budget Constraints

Moshe Shienman, Vadim Indelman

TL;DR本文提出了一种计算效率高的算法来解决智能体在感知受扰环境中的非近视信念空间规划问题，同时分析了预算限制对推理和规划的影响。

Abstract

autonomous agents operating in perceptually aliased environments should ideally be able to solve the data association problem. Yet, planning for future actions while considering this problem is not trivial. State

autonomous agents data association multi-modal hypotheses belief space planning computational efficiency

发现论文，激发创造

D2A-BSP: 基于蒸馏的数据关联信念空间规划实现预算限制下的性能保证

在存在多模态假设和环境感知混淆情况下，本文提出了一种基于置信空间规划的高效数据关联计算方法，并证明了提出方法的正确性与可行性

Feb, 2022

具数据关联意识的 POMDP 规划及假设修剪性能保证

针对部分可观测的马尔科夫决策过程，该论文提出了一种基于置信混合的规划算法来解决完全观测数据联合假设的限制，同时引入一种基于修剪的方法来解决数据联接不确定性，以在计算效率和性能之间建立折衷。

Mar, 2023

自适应概率信赖约束下的连续高维信念空间规划

研究了基于信念空间规划的在线决策问题，在信息收集等场景下，介绍了一种自适应的方法来寻求最大可行回报，应用这种方法可以在保证准确率的前提下显著加速在线决策过程，并进行了大量现实模拟来验证此方法的优越性。

Feb, 2023

信念空间搜索的计划图启发式方法

提供了一种基于状态距离测量的置信状态距离估计框架，利用聚合状态距离度量的方法来定义置信状态之间的距离，实现了一些技术来聚合状态距离及其关联属性，提出了几种规划图启发式方法的广义形式，利用 BDD 来计算最有效的技巧，这些启发式方法在两个规划器上得到了有效应用。

Mar, 2011

自适应信息信念空间规划

该研究旨在使用奖励函数来有效地做出明智的决策，通过提出抽象观测模型来降低计算成本并推导出期望信息论奖励函数的界限以及价值函数的界限，同时，提出了一种用于改善聚合方法的方法，实现了相同动作选择的计算时间减少。

Jan, 2022

部分可观测任务和运动问题中的信念空间在线重规划

本文提出了一个在线计划和执行系统，使用混合置信状态空间进行确定性代价敏感计划来选择成功概率高的观察行动和连续控制行动，以解决部分可观察问题，并在模拟和真实世界的厨房中展示了高效的解决方案。

Nov, 2019

高维非参数信念的信息化规划

本文提出一种计算信息论预期奖励的方法，运用信息量 (mutual information) 进行降维，开发出一个 Sequential Monte Carlo (SMC) 估计器，以避免未来信仰表面的重建，并将此方法应用于信息规划优化问题，最后在活动 SLAM 问题的模拟中评估该方法。

Sep, 2022

感知规划的因果信念分解：完备性结果和实用逼近

本文扩展了一种在规划中处理基于感知的信念跟踪的算法，该算法在可自定义的时间和空间范围内找出最可能的信念。此外，我们还引入了一种快速而有效的近似方法，该方法在时间和空间复杂度上都是指数级的，使算法可在高度宽但低因果宽度的领域中展现出最先进的实时性能。

Sep, 2019

空间环境下的近似贝叶斯推理

该论文介绍了一种基于模型的方法，利用概率推理和深度生成模型的方法，解决在空间环境中的定位、绘图、导航或自主探索等问题，并能够灵活地从数据中学习。该方法在两个不同的模拟环境中表现出了与专业最新方法相当的性能。

May, 2018

分解空间中的随机规划近似推断

该论文将随机规划分解成两个维度：正向和反向推断以及置信传播法和均值场变分推断等不同方法，进而提出折叠状态变分推断 (CSVI) 算法，并通过实验比较发现其与正向置信传播法是最佳的随机规划方法之一。

Mar, 2022