中位数启发式算法的大样本分析
探讨了决策理论问题中的非参数双样本检验与独立性检验,并指出使用核函数和点对之间的距离作为解决方案在高维设置中受到误解,测试的功率实际上随着维度的增加按多项式下降,提出了公平的替代假设,并阐明了核带宽选择中的中位数启发式的理论洞察力。
Jun, 2014
本文研究了最高密度区域的核估计,主要贡献有两个:第一,我们推导了一种适用于 HDR 估计的风险的带宽均匀渐近逼近,用于导出 HDR 估计的带宽选择规则,具有良好的渐近性质;第二,我们还展示了数字研究结果,说明了我们的理论和方法的优点。
Oct, 2010
本研究提出了一种新的自动,非监督的方法来选择高斯核带宽以优化 Support vector data description (SVDD) 算法的性能。
Aug, 2017
本文提出了一类基于核函数的两样本检验方法,其使用由深度神经网络参数化的核函数以确定两个样本集是否来自同一分布,适用于高维、复杂的数据,并在基准和实际数据上证明了其卓越的性能。
Feb, 2020
基于函数空间定义内核的最大均值差异(MMD)的非参数二样本检验程序,用于测试两个函数样本是否具有相同的潜在分布,建立在数据集维数增加情况下 MMD-based 测试效率的基础上。
Aug, 2020
当数据受到重尾噪声污染且可能包含大幅度的离群值时,本文介绍了一种通用方法,通过使用 Banach 空间中取值的可靠估计值,使得即使输入包含了已损坏的测量值也能产生可靠结果,并通过几个实例进行了说明,包括稀疏线性回归和低秩矩阵恢复问题。
Aug, 2013
本文对一种设计用于一般替代情况的流行的非参数双样本测试的功率进行了明确表征,并探讨了这些针对一般替代情况的测试在面对简单情况时的表现,具有高维场景下一般非参数测试的第一次明确功率推导以及如何在两个分布均值不同时,通过高斯核推导出最大均值偏差统计量的功率的性质。
Nov, 2014
研究通过 Paley-Wiener 重现核希尔伯特空间理论构建具有非渐近和分布自由保证的非参数同时置信区间带的问题,改进了现有算法的假设和约束,通过数值实验证明了改进的有效性。
Jan, 2024