WWWSep, 2018

学会合作:基于多智能体强化学习的多场景排名

TL;DR本文提出了一种能够对多种不同场景中排名策略进行联合优化的多智能体模型,其中包括了一个通信组件、多个私有智能体以及一个中央协调者,并通过在线评估结果证明了该模型能够显著提高整体性能。