May, 2024

维基贡献者的模拟、建模与分类:辨别优秀、恶劣和丑陋

TL;DR本文提出了一种模拟、建模和分类的方法来自动识别数据伪造,以平衡实验数据集中的类,构建和更新贡献者配置文件,并进行自动数据流分类,该方法在使用基于维基旅行的测试平台上表明显著提高分类器的可信度和质量,将恶意和良性机器人与人类贡献者区分度达到92%分类准确度。