Feb, 2025

一种针对临时团队协作的最小最大方法

TL;DR本研究解决了临时团队协作中对合作伙伴不确定性的问题,提出了一种最小最大-贝叶斯方法,优化针对对抗性先验的策略,而不是假设具体的合作伙伴分布。实验表明,该方法在恶劣情况下表现出比自我博弈、虚拟博弈和最佳响应学习更强的鲁棒性,强调了选择合适的队友训练分布的重要性。