AAAIJul, 2019

关于先验信念对政策类型实际影响的实证研究

TL;DR本文研究了多智能体应用中利用学习算法计算其他代理行为的后验概率与先验概率,我们发现先验概率对该方法的长期性能可能有显著影响,且影响程度取决于计划范围深度,自动方法可用于计算一致的先验概率,因此可以自动消除先验概率作为手动参数的需求。