Jul, 2021

基于POMDP的强化学习结构化世界信念

TL;DR这篇论文提出了一种名为“Structured World Belief”的模型,可用于学习和推理物体集中信念状态,通过SMC实现,提供多个物体集中场景的假设,以及一种新的物体集中动态模型,能够在长时间内跟踪不可见的物体状态,同时允许模型灵活关注图像中的任何空间位置,并显示其在强化学习、规划和监督推理中的有效性。