多维变分法引用工具,为减小标准核密度估计的偏差而推导出最优权重函数,从而改善预测后验概率和信息论度量的估计结果,并揭示了核密度估计的一些基本方面,尤其是作为主要构建模块的算法的视角。
Nov, 2023
本篇论文是一篇介绍核密度估计及其最近在置信区间,几何 / 拓扑特征方面的新进展的入门教程。论文从基本的 KDE 属性开始,介绍了收敛速率、密度导数估计和带宽选择等内容,接着介绍了常见的置信区间 / 带的构造方法以及如何处理偏差。然后,我们讨论了最近使用 KDE 推断密度函数的几何和拓扑特征的进展和如何用 KDE 估计累积分布函数和接收操作特征曲线。 文中提供相关的 R 实现。
Apr, 2017
研究了不同隐私保护机制,包括局部敏感量化的构造、带核的密度估计和增强隐私工具等,实现了快速,准确和隐私保护的数据操作。
Jul, 2023
该论文研究了基于局部敏感哈希实现无偏估算的核密度估计数据结构,旨在在高维数据集中实现高效的核密度估计,并提供比单纯随机抽样更好的理论保证。
Aug, 2018
ROME (RObust Multi-modal density Estimator) 是一种非参数密度估计方法,通过聚类将多模态样本分成多个单模态样本,并将得到的单独聚类的简单核密度估计结合在一起,以估计多模态、非正态和高相关性分布。与其他估计器相比,ROME 不仅在密度估计中表现出色,而且更具鲁棒性,能够克服其他估计器的过拟合和过度平滑问题,从而为概率机器学习模型提供更可靠的评估。
Jan, 2024
本文提供了一种新的核密度估计方法,通过引入边界约束条件,得到了一种非自伴扩散过程和非可分广义特征函数的展开,并通过统一变换法对其进行了严格分析,得到了一些理想的性质,并且在生物学上的应用具有更高的准确率和更快的速度,并且还演示了如何建立满足目标函数的边界条件的统计估计。
Sep, 2018
该论文提出了一种基于核函数的机器学习算法,可以通过对数据集的分组进行处理,采用独立同分布的样本集作为数据点,利用非参数估计器提取核函数特征从而实现多种分类、回归和异常检测等任务。
Feb, 2012
我们在本文中提出了一种基于核密度估计的多元密度表示机制,称为 KDEy,通过实验证明 KDEy 在量化性能上优于现有的分布匹配方法,并与目前在量化领域中的最强竞争者期望最大化方法展开比较。
Dec, 2023
我们提出了一种基于正则化密度的 Sobolev 范数的非参数密度估计的新方法,该方法与核密度估计不同,使模型的偏差清晰且可解释,虽然没有与其关联的核的封闭解析形式,但我们展示了可以使用采样来近似它,所需确定密度的优化问题是非凸的,并且标准梯度法性能不佳,然而我们展示了适当的初始化和使用自然梯度可以得到良好的解,最后,虽然该方法提供未归一化的密度,无法使用对数似然进行交叉验证,但我们展示了可以使用基于费歇分歧的得分匹配方法来完成此任务,我们在最近的安全检测基准套件 ADBenchn 上对所得方法进行了评估,发现排名第二,超过 15 种算法。
该论文研究了如何对 Transformer 架构应用一系列可靠的核密度估计方法,使其具有鲁棒性,实现对于污染数据的稳健性,并在语言模型和图像分类任务中进行了多项实证研究,结果表明该方法在多种场景下具有高鲁棒性。
Oct, 2022