Jul, 2015

假设行为中的信仰和真相

TL;DR研究了在多代理系统中如何利用贝叶斯学习来控制单一代理,从而完成任务并最大化收益,包括如何将证据纳入概率信念中,如何影响长期利润的先验信念以及如何检验推断类型的正确性。