Dec, 2023

高维对手塑造的扩展

TL;DR对于混合激励的多智能体环境中,通过学习对博弈对手产生影响的对手塑造方法,我们成功将其扩展到具有长期行动和长期视角的广义和博弈,提出了一个称为 Shaper 的简化版本,并证明 Shaper 在多种具有挑战性的环境中能够改善个体和整体的结果。