BriefGPT.xyz
Ask
alpha
关键词
asymptotic bias
搜索结果 - 2
批量强化学习在部分观测下的过拟合和渐进偏差
通过对有限数据情况下的渐近偏差与过拟合的权衡分析,本文探讨了在强化学习中的部分可观测性,通过较小的状态表示减少过拟合的风险,最终通过理论结论及实验结果验证了前述结论。
PDF
7 years ago
SG Langevin 动力学的(非)渐近性质
我们研究了使用固定步长的随机梯度 Langevin 动力学(SGLD)方法的特点及其偏差,并提出了一个修正的 SGLD 方法,在步长的一阶上消除了由于随机梯度方差引起的渐近偏差,并且得到了有限时间偏差、方差和均方误差(MSE)的界限。
PDF
10 years ago
Prev
Next