Mar, 2018

深度多智能体强化学习在顺序囚徒困境合作中的应用

TL;DR通过提出一种序列囚徒困境游戏和使用深度多智能体强化学习方法进行研究,本文探讨互相合作演化趋势。实验表明,该策略可避免被攻击并与合作的对手实现合作。