Nov, 2022

资源受限的目标 POMDP 中的屏蔽

TL;DR该研究考虑了部分可观察的马尔可夫决策过程(POMDP),并研究了一个问题,即如何在资源有限制的情况下实现目标最小化成本。该研究设计了一种算法用于计算特定情况下的“防护措施”,并将该防护措施与启发式搜索算法相结合,实现了对该问题的解决。通过实验证明了该算法的实用性。