ICCVJan, 2020

通过自我博弈学习多智能体协商

TL;DR这篇论文通过深度强化学习中的自我对战迭代程序展示了如何创建越来越多样化的交通场景并学习多智能体协作策略提高合并操作成功率。