BriefGPT.xyz
Feb, 2025
一种针对临时团队协作的最小最大方法
A Minimax Approach to Ad Hoc Teamwork
HTML
PDF
Victor Villin, Thomas Kleine Buening, Christos Dimitrakakis
TL;DR
本研究解决了临时团队协作中对合作伙伴不确定性的问题,提出了一种最小最大-贝叶斯方法,优化针对对抗性先验的策略,而不是假设具体的合作伙伴分布。实验表明,该方法在恶劣情况下表现出比自我博弈、虚拟博弈和最佳响应学习更强的鲁棒性,强调了选择合适的队友训练分布的重要性。
Abstract
We propose a
Minimax
-Bayes approach to
Ad Hoc Teamwork
(AHT) that optimizes policies against an adversarial prior over partners, explicitly accounting for
→