利用专门分类器集成检测新型社交机器人
本论文从 Twitter 账号出发,提出了使用卷积神经网络的新型算法,将账号执行的操作序列转化为图片,并进行图像分类,从而进行 bot 检测。结果证实了该方法的有效性,因为它与现有技术处在同一水平,并在某些情况下更好。
Apr, 2023
本文旨在提出一种一般化 Twitter 机器人检测评估方法,通过测试它们在未看到的机器人类别上进行分类,评估机器人分类器的方法论,该方法对机器人的大小和特性进行了验证,并培训了一个分类器,精度达到 97%以上。
Sep, 2018
本研究提出一种基于最少账户元数据的框架,实现了对 Twitter 公共推文全量实时分析的高效和可靠的社交机器人分类,通过对训练和验证的大量数据集进行严格的验证系统,找到了挑选子集进行训练的方式比全量训练更好的模型精度和泛化性。
Nov, 2019
我们提出了一种基于自监督对比学习的社交机器人检测框架(BotSSCL),通过利用对比学习在嵌入空间中区分社交机器人和人类,改善了线性可分性。BotSSCL 的高级表示增强了对数据分布变化的鲁棒性并确保了泛化性能。实验证明,BotSSCL 在两个数据集上的性能较其他监督、无监督和自监督基准方法都要高,并且在不同数据集间的测试也表现出较好的泛化性能。此外,BotSSCL 还提高了对抗复杂性,使对手在逃避检测方面的成功率只有 4%。
Feb, 2024
该论文提出了一种基于深度神经网络的机器人检测方法,通过使用元数据并将其作为辅助输入,CNN 处理推文文本。同时,作者们提出了一种基于合成少数过抽样的技术,从少量已标记数据(大约 3000 个 sophisticated Twitter bots 的样例)生成适合深度 CNN 训练的大型标记数据集。作者还在账户级别的机器人检测中应用了相同的架构,并在保证小型和可解释特征,以及最小训练数据的情况下,实现了几乎完美的分类准确度。从仅一个推文中,我们的体系结构就可以实现高分类精度(AUC > 96%)将机器人与人类分开。
Feb, 2018
本文提出了一个基于超过一千个公共数据和元数据特征的框架,用于检测 Twitter 上的社交媒体自主实体(即社交媒体机器人)。经测试,此框架能够与公开的 Twitter 机器人数据集高度契合,可以检测不同类型的机器人,如垃圾邮件发送者、自我推广者和使用连接应用程序发布内容的账户等,并且估计在活跃的 Twitter 账户中有 9% 至 15% 的机器人,机器人相互之间的交互关系有助于研究用于相互之间通信的转发和提到策略。
Mar, 2017
该研究采用基因算法综合当前最先进的社交机器人,通过操纵 Twitter 社交机器人的发展演变,提高社交机器人检测技术的有效性。结果表明,该方法逃避了当前的检测技术,但揭示了人们改进这些技术所需的要素。
Apr, 2019
本研究基于真实数据集构建了行为序列,从中提取关键特征,分析了社交机器人和真实用户之间的差异性,提出了一种新型社交机器人检测系统 - BotShape,通过行为序列和特征分类器自动捕获机器人。该系统在对比其他研究后表现更好,通过提供重要的行为特征可提高大多数方法的性能。评测结果表明,BotShape 检测系统在各种分类器中的平均准确率为 98.52%,平均 f1-score 为 96.65%。
Mar, 2023
MulBot 是一种基于多元时间序列(MTS)的无监督机器人检测器,利用 LSTM 自编码器处理多维时间特征并在编码表示上执行聚类以检测机器人行为。在检测和分离不同机器人网络的多类别分类任务中,MulBot 实现了 f1-score=0.96,并解决了监督机器人检测器通常存在的泛化不足问题。
Sep, 2022
社交机器人在在线社交网络中扮演重要角色,最近生成式人工智能(GenAI)的进展使得社交机器人能够产生高度逼真且复杂的内容,模仿人类创造力。为了识别这些虚假内容并区分其生成者,对该问题的多种方法已经被提出,但这些解决方案的广泛评估尚未进行。为了解决这个问题,我们评估了一个基于文本的机器人检测器在一个有竞争环境下的行为,对不同类别的社交机器人进行了全面的评估,并展示了一些可以用于未来工作的成果。
May, 2024