BriefGPT.xyz
Ask
alpha
关键词
$q$-value functions
搜索结果 - 1
最优值估计中的实例最优性:通过方差缩减 Q 学习实现自适应
本文提出一个本地极小极大方法,分析了计算强化学习下的最优 $Q$ 值函数的实例特定行为,并提供一个针对 $Q$ 学习中困难问题和易解问题的有力解释。
PDF
3 years ago
Prev
Next