Feb, 2024

SUB-PLAY: 针对部分观测多智能体强化学习系统的对抗性策略

TL;DR多智能体强化学习中的安全威胁及对策的研究,包括针对对手生成敌对策略时的部分可观测性限制的黑盒攻击方法以及针对这些策略的潜在防御方式的评估和建议。