Nov, 2022

使用虚拟对手模型进行决策

TL;DR提出了一种基于分布式 Actor-Critic 算法的多智能体虚拟对手建模方法,通过构建虚拟模型来模拟未观察到对手的行为,使用本地可得信息实现虚拟对手模型的训练和优化。实验证明该方法能有效准确地模拟对手行为,相较于基线方法具有更快的收敛速度并显著提升了性能表现。