大网络中的简洁模块推断
从动态或行为数据中重建网络的一个基本问题在于以能够防止过拟合的方式确定最适合的模型复杂度,并生成具有统计合理边数的推断网络。与常见做法 L1 正则化结合交叉验证相比,本文提出了一种基于层级贝叶斯推断和权重量化的非参数正则化方法,该方法能够提高网络重建的准确性,并且不需要事先知道边的数量。特别是在关于大规模物种数量的微生物群落间相互作用网络重建方面,我们展示了该方法的应用,并演示了利用推断模型预测系统干预结果的能力。
May, 2024
提出了一种新的概率图模型结构学习方法,通过在随机变量实例化级别上操作来学习,推广和解释在这些难以捉摸的领域中,从而解决机器学习方法在精度不尽如人意的情况下的问题,并且通过 Bayesian Knowledge Bases(BKBs)来利用 Information Thermodynamics 和 MDL 原理解决了结构化选择问题并提高了学习效果,最终运用在乳腺癌基因突变数据学习基因调节网络。
Mar, 2023
研究使用最小描述长度(MDL)原则基于样本复杂性学习贝叶斯网络,并提出了使用样本复杂性结果加速学习过程的方法,同时表明了以熵距离为误差阈值的 epsilon-close 近似所需样本数量是 O ((1/epsilon)^(4/3) log (1/epsilon) log (1/delta) loglog (1/delta))。
Feb, 2013
通过具备多重尺度的完全描述网络层次结构的嵌套概率模型,可避免现有方法的局限性,在更高的分辨率下检测模块化结构并确保不产生伪模块,且具有一般性和可扩展性,适用于大型网络的高效算法
Oct, 2013
这篇论文是一篇对最小描述长度(MDL)原理的介绍和概述,讨论了在统计学、机器学习和模式识别等领域中广泛应用的归纳推理理论。MDL 可以被视为惩罚最大似然和贝叶斯方法的一种强大扩展,其中惩罚函数和先验分布被替换成更一般的幸运函数。
Aug, 2019
本文提出了一种有效,有原则和可解释的技术,用于推断模块的分配并确定给定网络中的最佳模块数量,提出的方法基于贝叶斯方法来进行模型选择,应用该技术于合成和实际网络中,并概述了该方法自然地允许在竞争模型中进行选择。
Sep, 2007
本文介绍了利用贝叶斯推断从网络数据中提取大规模模块化结构的方法,重点介绍了基于随机块模型(SBM),以及其度修正和重叠推广。提供了一种允许防止过度拟合,实现模型选择的非参数公式。讨论了先验选择的方面,特别是如何通过加强贝叶斯层次结构来避免欠拟合,同时描述了执行单点估计和采样网络分区的有效算法。还展示了如何利用推断 SBM 来预测丢失和虚假链接,并揭示了网络中模块化结构可检测性的根本限制。
May, 2017
本文介绍了一种对大型网络中的随机块模型进行推理的高效算法。该算法可作为优化的马尔科夫链蒙特卡罗方法或贪婪凝聚启发式算法使用,并且在许多人工和实际网络中均能产生几乎与更精确和昂贵的 MCMC 方法不可区分的结果,并且不偏向于任何特定的混合模式,特别是不倾向于同质的社区结构。
Oct, 2013
使用最小描述长度 (MDL) 原则和贝叶斯网络学习算法的改进版本,我们探讨了对已存在的贝叶斯网络的结构进行精炼的问题,同时我们通过实验证据表明了我们的方法的有效性。
Feb, 2013
本文利用统计物理的空穴方法,对社交和生物网络中的随机块模型进行了研究,从拓扑学的角度来推断功能群或社区。我们详细描述了一些性质,例如检测性 / 不可检测性的相变和社区检测问题的易于 / 困难的相变,并将分析自然翻译为信念传播算法。该算法在最优方式下推断节点的组成员资格,并学习该块模型的潜在参数,最后应用于两个真实世界的网络并讨论其性能。
Sep, 2011