Apr, 2020

基于模型的强化学习的博弈论框架

TL;DR本文提出了一种新的框架,将基于模型的强化学习(MBRL)视为博弈,通过构建领导者与跟随者之间的Stackelberg博弈来简化算法设计,并设计了两种自然算法家族,旨在促进样本效率。