KDDAug, 2021

随机控制的主动推断

TL;DR研究指出,由于无法充分建模随机转换动态,特别是在计划期间评估广泛的策略空间时,计算实现大多受限于低维确定性设置。最近的进展提出了一种修改的规划算法,我们在此基础上评估了主动推理在随机控制环境中的效用,结果表明与强化学习相比,无论在确定性还是随机性环境中使用主动推理都具有优势。