Mar, 2021

双线性类:在 RL 中可证明的泛化的结构化框架

TL;DR引入了新的框架 Bilinear Classes,用于增强学习的泛化,适用于通过函数逼近实现多种模型,其中 Best Known Sample Complexity Bounds 几乎与现有模型相匹配。