Jan, 2013

公平性、互信息和最大信息系数

TL;DR提出了一种新的统计量 —— 最大信息系数 (MIC),用于量化随机数量对之间的任意依赖关系,但证明了 MIC 不满足平等性定义。因此,我们提出了自洽且更普遍的平等性定义,并表明互信息满足这一新的定义,而 MIC 则不满足。最后,证明了 Reshef 等人提供的模拟证据是人为的。因此,我们得出结论,估计互信息不仅在许多实际应用中是可行的,而且还提供了一个自然的解决方案来量化大数据集中的相关性问题。