BriefGPT.xyz
Ask
alpha
关键词
bootstrapped and constrained pessimistic value iteration
搜索结果 - 1
AAAI
线性函数逼近离线强化学习的基于实例的上界
本研究提出了一种基于 Bootstrapped and Constrained Pessimistic Value Iteration 算法的离线强化学习方法,该算法结合数据自举、约束优化和悲观主义。在局部数据覆盖的假设下,该算法提供了一个
→
PDF
2 years ago
Prev
Next