Mar, 2025

零样本人机协调的自动课程设计

TL;DR本研究解决了现有零样本人机协调方法在未见环境中的泛化能力问题。通过扩展多智能体无监督环境设计方法,提出了一种新的效用函数和合作玩家采样策略,从而提升了自我代理与人类的协调能力。实验结果表明,该方法在未知环境中显著提高了人机协调性能,优于其他基线模型。