关于 $d$- 无关随机变量的联合熵
通过子集联合熵的任意集合,得到一组随机变量的联合熵的上下界,同时展现了这些不等式对拟模函数的一般新结果的特殊情况,进而得到解决组合学问题、矩阵理论、相对熵等方面的新不等式。
Dec, 2008
针对使用观测数据确定两个离散随机变量之间的因果方向的问题,我们在最一般的函数模型条件下,在未观测到的外源变量上作出简化假设,使用 Rényi 熵来量化其简单性。我们的主要结果是,如果该外源变量在正确的方向上的 H0(熵)熵较低,那么它在错误方向上的 H0 熵一定较高。我们提出了一种基于最小熵耦合问题的贪心算法,用于找到具有最小熵的外源变量,并将其应用于因果推断问题。
Nov, 2016
本研究探讨了 Shannon 信息度量的某些优化问题,包括在凸区域上极小化联合和条件熵(H(X,Y),H(X | Y),H(Y | X))和最大化互信息(I(X;Y)),并介绍了新(伪)度量,并证明了它们的计算是 NP-hard 的。
Jul, 2012
我们提出了一种用于检验 $d$ 个可能连续或不连续的随机变量是否相互独立的方法,该方法利用了二元 Hilbert-Schmidt 独立性准则(HSIC)的思想并允许任意数量的变量,将 $d$ 维联合分布和边缘乘积嵌入到再生核 Hilbert 空间中并定义 $d$ 变量的 Hilbert-Schmidt 独立性准则(dHSIC)为嵌入之间的平方距离。在总体情况下,只要核是特征的,dHSIC 的值为零则说明 $d$ 个变量相互独立。基于对 dHSIC 的经验估计,我们定义了三种不同的非参数假设检验:置换检验、自举检验和基于 Gamma 近似的检验。我们证明了置换检验达到了显著水平,并且自举检验也达到了点态渐近显著水平以及点态渐近一致性(即它能够在大样本极限中检测任何类型的固定依赖性)。Gamma 近似没有这些保证,但它在计算方面非常快,并且对于较小的 $d$,它的性能良好。最后,我们将该检验应用于因果发现问题。
Mar, 2016
本文给出了当函数 f 不是一对一关系时 H (f (X)) 的紧密下界,并且当只知悉极大和极小概率之间比率的限制时,获得了概率分布熵的下界,该下界已经超越了文献中的先前结果,并且它在本文中的几种情形下有实际应用。
Dec, 2017
本文研究有限边缘集上香农信息量度的一些一般特性以及与最优化问题的关系,引入最小熵耦合的概念及其在信息理论、计算和统计学上的相关性,并研究由这些耦合所定义的偏度量族,特别是它们与总变差距离的关系,并给出对条件熵的新的表征。
Mar, 2013
本研究针对离散分布 P 进行 n 个独立同分布样本的香农熵估计,使用逼近理论法进行估计,实现了在估计熵的最小二乘率方面的极致。通过采用自适应估计框架,该方法相对极小值优化估计方法在分布 P 的嵌套子序列上实现了最小二乘率的估计,从而进一步证明了估计在样本 n 的情况下是最优的,并且基本上相当于 MLE 使用 nlnn 个样本进行估计。
Feb, 2015
我们发现在 A. Kraskov 等人的文章中声称两个实值随机变量之间的互信息的下界存在错误,并提出了一种新的方法建立在较弱的假设下得到较紧的下界,并在基因表达数据中展示了这种方法的实用性。
Aug, 2010