Jul, 2018

基于人群的深度强化学习在第一人称多人游戏中达到人类水平的表现

TL;DR本研究提出了一个新颖的两层优化过程来训练共有多个独立的强化学习智能体,这些智能体仅使用Q3A视频游戏的像素和游戏得分作为输入,即使在富有挑战性的多智能体环境中互相协作和竞争,这些智能体也能够达到类人水平,并展现出人类般的行为表现。