May, 2023

了解你的敌人:在 Pommerman 中使用对手模型研究 Monte-Carlo 树搜索

TL;DR本研究探讨了将多人博弈转化为单人和双人博弈的技术,并通过使用启发式和自我对弈等方法,研究了对手建模的现象。同时在监督学习和强化学习环境下展示了多人搜索变异体的有效性。