BriefGPT.xyz
Ask
alpha
关键词
sequential decision-making strategies
搜索结果 - 1
通过可微函数逼近离线强化学习的有效性能得到保证
使用不同 iable 函数类逼近的离线强化学习方法在实践中得到了广泛应用,它结合了各种具有非线性和非凸结构的模型,能够显著提高算法性能;本文分析了一种最悲观的算法,并证明这种方法的有效性,为探究强化学习与不同 iable 函数逼近方法提供了
→
PDF
2 years ago
Prev
Next