本文研究了算法精度的量化计量问题,基于正则化互信息熵提出了一种标准化测量方法,并与 Omega 指数等其他方法进行比较,以解决社交网络分析领域中重叠聚类的精度计量问题。
Oct, 2011
本文介绍了互信息这一信息论中的重要量,在分类学和社区检测分析中被广泛应用,但在实际应用中常常会由于丢失关键的部分而产生误差。针对这一问题,本文提出了一种修正的互信息量,并讨论了该量化指标的实际实现方法和实例应用。
Jul, 2019
本文通过对四个广泛使用的网络聚类算法的严格分析,研究了独立集群质量指标和信息恢复度量之间的关系,并发现不同集群质量度量的结果存在显着差异,其中 conductance 是最能表明信息恢复度量性能的单独质量度量,但这也存在缺陷。在人工合成图和不同规模的实际数据集上的实验表明,Smart Local Moving 算法的表现最佳,但是各个算法的聚类评估指标的差异需要进行更多的研究。
May, 2016
本文介绍了一种名为 CRank 的算法,可以用于网络社区检测,优先选择对下游实验有帮助的候选模块,实验结果表明,CRank 在社区优先选择方面取得了近 50 倍的改善。
May, 2018
通过比较社区结构识别的不同方法,特别是最近提出的模块度量,研究了这些方法在已知社区结构的自组织网络中的性能表现,并发现最准确的方法往往更昂贵,因此在选择方法时需要考虑计算成本等因素。本研究旨在提出一个标准的基准测试,作为社区检测方法的介绍和建议。
May, 2005
本文探讨了一些网络社区检测方法,比较它们的性能和系统偏差;评估了用于形式化网络社区概念的几种常见目标函数,并研究了几种旨在优化这些目标函数的近似算法。此外,本论文还考虑了问题的大小解决版本,从社区大小的角度来考虑社区质量,以更好地检验社区检测算法,因为目标函数和近似算法通常具有不明显的大小依赖行为。
Apr, 2010
本文提出了一种半监督社区检测算法,该算法利用网络拓扑和部分已知社区标签对新节点进行社区标签估计。该算法使用修正节点度数的随机块模型来对网络进行建模,并计算新节点与每个社区之间的结构相似度指标,从而预测新节点的社区标签。该算法在理论和实践中均证明了其有效性,是首个提供理论保证的半监督社区检测算法。
Jun, 2023
该论文研究了真实世界中的网络社区,并提出了一种基于群组成员身份识别的、可靠的地面真相社区定义方法,并比较了 13 种常用的结构定义方法,发现 Conductance 和 Triad-participation-ratio 表现最佳;此外,还提出了一种改进的局部谱聚类算法,可以很好地识别社区,且可以适用于规模较大的网络。
May, 2012
文章测试了多种算法,并针对新的基准图进行了评估,结果表明 Rosvall and Bergstrom、Blondel et al. 和 Ronhovde and Nussinov 三种算法表现出色,并具有低计算复杂度优势,适用于大型网络分析。
Aug, 2009
研究网络的 meso-scale 特征,使用不同的 community-identification 程序,比较不同的 community 大小,识别多个 size-resolved 的 community 结构,并提出局部偏置方法比全局 community-detection 方法更实用,同时也强调 better benchmark 网络的重要性。
Mar, 2014