Oct, 2023

隐藏和寻找” 问题的多智能体强化学习复制

TL;DR强化学习中的文档化和可重现性不足,该研究使用类似 OpenAI 躲藏者和追踪者的模拟代理,通过增加飞行机制,扩大了可行动和策略范围,从而改善了躲藏者代理的追逐策略。