Oct, 2019

基于影响力的多智能体探索

TL;DR为了解决探索性任务中的探索难题,本文针对具有转换依赖性的多智能体环境提出了两种探索方法:基于信息论影响的探索(EITI)和基于决策论影响的探索(EDTI),通过利用智能体协作行为中交互作用的作用加以利用。我们通过优化这两种方法来鼓励智能体协调他们的探索和学习策略,最终通过在多智能体环境中的实验演示了我们方法的高效性。