Oct, 2023
使用偏好行为合作伙伴量化零样态协调能力
Quantifying Zero-shot Coordination Capability with Behavior Preferring Partners
Xihuai Wang, Shao Zhang, Wenhao Zhang, Wentao Dong, Jingxiao Chen...
TL;DR零 - shot 协调(ZSC)是一个新的挑战,主要关注将学到的协调技能推广到未见过的合作伙伴。我们提出了一个可靠、全面且高效的评估方法,包括构建多样化的评估合作伙伴和多维度度量的最佳响应接近(BR-Prox)度量。在 Overcooked 环境中重新评估了强大的 ZSC 方法,结果显示一些最常用的布局无法区分不同 ZSC 方法的性能。同时,评估的 ZSC 方法必须产生更多多样化和高性能的训练合作伙伴。我们提出的评估流程呼吁改变如何高效评估 ZSC 方法,并作为人工评估的补充。