Oct, 2023

关于基于模型和无模型强化学习的表示复杂性

TL;DR通过实证研究,我们证明了在电路复杂度的背景下,基于模型和无模型的强化学习在表示复杂度方面的差异,揭示了模型为基础的算法通常比无模型的算法在样本复杂度上表现更好的原因,并为未来的研究提供了一个严格的框架。