Jul, 2022

随机市场博弈

TL;DR本文提出了利用市场力量鼓励多智能体系统中的协作行为,以应对智能驾驶或者工厂作为服务的具有相互冲突目标的混合动机场景。作者在包括囚徒困境博弈等迭代环节中证明了他们提出的市场推荐机制可以持续地学习协作策略,并证明在不同的智能体数量上,在时间和空间上的考验下,利用市场力量可以提高整体效果和智能体单个回报。