AAAIDec, 2023

同行学习:通过动作建议从零开始学习复杂策略的群体

TL;DR同行学习是一种新颖的高级强化学习框架,用于群体学习。通过研究代理人的学习行为,我们发现同行学习能够在多个具有挑战性的离散和连续动作空间中胜过单个代理人学习和基准方法,并能够从行为建议中发展出复杂策略。