Jun, 2024

通过分层对手建模和规划在混合动机环境中实现高效适应

TL;DR基于 Hierarchical Opponent Modeling and Planning (HOP) 算法的多智能体强化学习能够在混合动机环境中实现对未知策略的少样本适应,并显示出在不同未知对手和自对弈场景中优越的适应能力,同时在复杂多智能体环境中表现出社交智能的潜力。