Oct, 2013

社交媒体中的 Memes 聚类

TL;DR本研究提出了一种基于聚类的框架来检测社交数据流中的谣言,评估了基于内容、元数据、网络特征和它们的组合的各种相似度度量,并探索了预聚类的想法。系统评估表明,预聚类和异质特征的组合产生了最佳的聚类数量和质量的平衡,证明了一种简单的基于相似性的组合方式与参数优化同样有效。我们的方法是全自动、无监督的,并可实现流数据的实时检测。