探究空间相关性度量的信息论根源
本文提出了一个使用再生核希尔伯特空间中的算子直接从数据中非参数地获取熵测度的框架,并定义了类似于量子熵的熵泛函,此方法避免了估计底层概率分布。同时定义了基于核的条件熵和互信息的估计量,并在独立性测试上进行了数值实验且表现良好。
Nov, 2012
通过因果关系解释的虚假相关的条件互信息,我们提出了一种信息熵偏差测量技术,可以有效地识别基于特征的算法偏差,并设计了一种新颖的基于偏差正则化损失的去偏差框架和一种基于随机标签噪声的简单而有效的非监督去偏差技术。
Jan, 2022
科学和工程中的大维度实证数据往往具有低秩结构,并可表示为仅由少数特征模式的组合。本研究基于数据训练给出了传感器相互作用的完整景观,采用了统计物理学中的伊辛模型,从而优化了传感器布置并利用了外部选择准则。
Jul, 2023
本文研究有限边缘集上香农信息量度的一些一般特性以及与最优化问题的关系,引入最小熵耦合的概念及其在信息理论、计算和统计学上的相关性,并研究由这些耦合所定义的偏度量族,特别是它们与总变差距离的关系,并给出对条件熵的新的表征。
Mar, 2013
本文运用量子统计力学的技术来定义复杂网络的熵度量,并开发了一组基于网络谱属性的信息理论工具,可以用于最大似然估计和模型选择。通过将这个框架应用于人体微生物组的网络,我们通过层次聚类分析高精度地恢复出现有的社区关联。
Sep, 2016
提出了一种相对于符号丰度和相似度的熵的概念,引申到信息论中的几个概念和定理的几何意义,提出了一种与 Wasserstein 距离方法相当的理论,但具有可以高效计算的闭式表达式,通过实验表明了所提出方法的广泛应用性。
Jun, 2019
本文总结并将现有的信息论依赖度量的主要思想推广到更高层次的透视图,并基于此提出了两种测量依赖性的新方法,分别是基于矩阵的归一化总相关量和基于矩阵的归一化双重总相关量,用于量化多变量在任意维度空间中的交互依赖关系,同时探究其在基因调控网络推理、机器学习、异常值检测以及卷积神经网络学习动态等四个问题中的应用,以此展示其实用性、优点和意义。
Jan, 2021