Oct, 2023

使用偏好行为合作伙伴量化零样态协调能力

TL;DR零 - shot 协调(ZSC)是一个新的挑战,主要关注将学到的协调技能推广到未见过的合作伙伴。我们提出了一个可靠、全面且高效的评估方法,包括构建多样化的评估合作伙伴和多维度度量的最佳响应接近(BR-Prox)度量。在 Overcooked 环境中重新评估了强大的 ZSC 方法,结果显示一些最常用的布局无法区分不同 ZSC 方法的性能。同时,评估的 ZSC 方法必须产生更多多样化和高性能的训练合作伙伴。我们提出的评估流程呼吁改变如何高效评估 ZSC 方法,并作为人工评估的补充。