Jun, 2024

使用自然语言处理测试网络聚类算法

TL;DR在线社交网络的出现导致了关于在线社交群体及其与个体个性关系的丰富文献的发展。通过对广泛的社交互动进行推断,可以得到社交结构,这些互动形成了复杂的、有时是多层次的网络,对其中的高阶结构进行了社群检测算法的提取。然而,关于社群检测算法在与其分类的个体文化生产之间的关系,却很少受到质疑。在这项工作中,我们假设社交网络及其文化生产是纠缠在一起的,并提出了一种基于文化的在线社交群体的定义,即将在线产出归类为社群相关的个体集合。我们利用这种似乎自指的在线社交群体描述,结合社区检测算法和自然语言处理分类算法的混合方法。该分析的一个关键结果是可以使用自然语言处理分类算法的准确度来评价社群检测算法的得分。另一个结果是我们可以以超过 85% 的准确率分配随机用户的意见。