IJCAIMay, 2024

通过选择性交互和长期经验增强多智能体强化学习中的合作

TL;DR基于多智能体强化学习的计算框架通过模拟囚徒困境游戏中的长期经验使智能体能够选择困境策略和互动邻居,并发现长期经验使智能体能够识别非合作邻居并偏好与合作邻居互动,进而导致具有相似策略的智能体聚集,增加网络互惠性和加强群体合作。