Mar, 2020

太多厨师:用贝叶斯推理协调多智能体合作

TL;DR本文提出了一种基于 Bayesian Delegation 的分散式多智能体学习机制,通过逆向规划实现智能体对他人潜在意图的快速推断,实现协调和合作,展示在多智能体马尔可夫决策过程中的成功应用。