通过 $k$- 最近邻距离高效估算多元熵
本文提出了一种加权仿射组合的概率密度估计方法,通过求解一个离线的凸优化问题来确定权重,从而获得一个在维数上具有维度不变性的估计器,该方法在实际应用中表现出优越的性能。
Mar, 2012
本文对 Kozachenko-Leonenko 估计器在扭曲空间中的微分熵进行了分析,提出了首个关于其性能的均匀上界估计和新的极小化下界估计,并且证明了 KL 估计器在不考虑 H"older 球的平滑参数时,可以达到极小化速率,成为第一个可以明确满足此属性的估计器。
Nov, 2017
本文提出了一种基于非参数估计和广义最近邻图的计算 Renyi 熵和互信息的算法,证明了这种算法的几乎必然一致性和上限的收敛速度,并在实验中展示了其在独立子空间分析中的实用性。
Mar, 2010
提出一种基于混合成分之间的成对距离函数的家族估计器,该家族具有许多优越的性质,可用于计算混合熵,并在优化最大化 / 最小化熵和互信息的问题中非常有用,例如 MaxEnt 和速率失真问题。
Jun, 2017
本文研究了基于 $KSG$ 估计的互信息估计中,样本数对偏差收敛速度的影响,发现了 $KSG$ 估计器的优越性能来源于 “相关性提升” 效应,并通过改进 $KSG$ 估计器构建出更优秀的估计器。
Apr, 2016
本研究提出了一个通用的框架,用于使用 k 最近邻算法估计非参数连续概率密度的泛函,包括熵和散度。该框架将多个先前的估计器统一起来,并提供了首个有限样本保证。
Jun, 2016
在独立样本的基础上,通过多项式逼近构建最优估计器并证明了最小均方误差与自然对数的平方存在关系,进而推导出最小样本量与以 K 为底的对数的比例成正比的一般规律.
Jul, 2014
本篇论文研究了基于 KL 散度的复杂度度量方法,为确定性和随机密度估计器的统计复杂度提供了一般的信息理论不等式,并发现这种技术可以改进一些经典结果,特别是可以导出干净的有限样本收敛界限。
Feb, 2007
提出了新的图论解释下的直接估计方法,用于估计 Renyi 和 f-divergence 的度量。通过对 Y 中 k-NN 方案点和 X 中点数之间的平均功率进行估计,可以获得两个密度之间的 Renyi divergence 估计值,并且这种方法可以用于估计 f-divergence 度量。通过使用加权合成估计技术,该方法可以用于具有连续和有界导数的密度函数的估计,其能够获得参数 MSE 率 O (1/N)。
Feb, 2017