BriefGPT.xyz
Ask
alpha
关键词
batch-mode
搜索结果 - 1
ICML
平滑贝尔曼误差嵌入的尖锐分析
研究了使用 Smoothed Bellman Error Embedding 算法在 batch-mode 强化学习中的理论行为,并基于近期研究的工作,证明了该算法在使用的函数类表示能力和紧密的分布转移概念下,可以实现近乎最优的性能保证。
PDF
4 years ago
Prev
Next