AAAIJun, 2020

对手学习建模的学习

TL;DR提出了一种名为 LeMOL 的对手学习动态建模方法,该方法用于结构化对手建模,以通过学习对手的适应和学习行为来降低策略搜索算法中的方差,从而提高多代理系统中算法代理的性能。