ICMLJul, 2020

平滑贝尔曼误差嵌入的尖锐分析

TL;DR研究了使用 Smoothed Bellman Error Embedding 算法在 batch-mode 强化学习中的理论行为,并基于近期研究的工作,证明了该算法在使用的函数类表示能力和紧密的分布转移概念下,可以实现近乎最优的性能保证。