BriefGPT.xyz
Ask
alpha
关键词
empirical process theory
搜索结果 - 3
基于核的时间差分方法的最优策略评估
本文提出一种基于重现核希尔伯特空间的方法来估算无限时间折扣马尔可夫奖励过程的值函数的方法,并使用经验过程理论技术导出了误差的上界,同时证明了在样本大小 n 和有效时间跨度 H = (1-gamma)^{-1} 方面具有最优的最小值。
PDF
3 years ago
估计纠缠单样本分布中的位置参数
本研究考虑了独立采样数据的公共平均值估计问题,提出了一种估计器,它能够适应数据异质性的水平,在 i.i.d. 和某些非同质的设置下均达到近似最优,其估计器既考虑了传统统计学中的模态区间、shorth、中位数估计器,又利用了新型
→
PDF
5 years ago
高维低秩矩阵的估计
本文研究用惯性系数约束和 Frobenius 范数限制下的惩罚最小二乘估计的 Schatten-p 准范惩罚项估计法,能够有效地在高维数据下进行矩阵估计。
PDF
15 years ago
Prev
Next