利用在线用户画像检测 Twitter 上的社交机器人
本文提出了一个基于超过一千个公共数据和元数据特征的框架,用于检测 Twitter 上的社交媒体自主实体(即社交媒体机器人)。经测试,此框架能够与公开的 Twitter 机器人数据集高度契合,可以检测不同类型的机器人,如垃圾邮件发送者、自我推广者和使用连接应用程序发布内容的账户等,并且估计在活跃的 Twitter 账户中有 9% 至 15% 的机器人,机器人相互之间的交互关系有助于研究用于相互之间通信的转发和提到策略。
Mar, 2017
本论文从 Twitter 账号出发,提出了使用卷积神经网络的新型算法,将账号执行的操作序列转化为图片,并进行图像分类,从而进行 bot 检测。结果证实了该方法的有效性,因为它与现有技术处在同一水平,并在某些情况下更好。
Apr, 2023
该论文提出了一种基于深度神经网络的机器人检测方法,通过使用元数据并将其作为辅助输入,CNN 处理推文文本。同时,作者们提出了一种基于合成少数过抽样的技术,从少量已标记数据(大约 3000 个 sophisticated Twitter bots 的样例)生成适合深度 CNN 训练的大型标记数据集。作者还在账户级别的机器人检测中应用了相同的架构,并在保证小型和可解释特征,以及最小训练数据的情况下,实现了几乎完美的分类准确度。从仅一个推文中,我们的体系结构就可以实现高分类精度(AUC > 96%)将机器人与人类分开。
Feb, 2018
本研究提出一种基于最少账户元数据的框架,实现了对 Twitter 公共推文全量实时分析的高效和可靠的社交机器人分类,通过对训练和验证的大量数据集进行严格的验证系统,找到了挑选子集进行训练的方式比全量训练更好的模型精度和泛化性。
Nov, 2019
采集了一份大规模的多语言社交话语 Twitter 数据集,并通过 Twitter API 和 Botometer 提供的已带标签的 Twitter 账号数据集与另外两个热门话题(即 2022 年能源危机和阴谋论讨论)来检测 Twitter 上的机器人账号,利用基于 XGBoost 模型的新型机器学习模型和大量标记数据集相结合,可以在不同的时间段内,独立于 Twitter API 对数据集进行标记,相比于 Botometer,在两个实际应用数据集上实现了平均 11% 更高的 ROC-AUC 得分。
May, 2023
通过在线社交实验,发现没有信任、档案和复制用户行为目标的机器人可通过基本的社交探测活动在社交媒体上获得社交相关性,进而有效地引导用户的社交连接选择,并揭示了隐蔽的社交极化模式和用户感知的微妙隐私风险。
Jul, 2014
BotOrNot 是一个公开的服务,它利用一千多个特征来评估 Twitter 帐户与社交机器人已知特征的相似度。自 2014 年 5 月发布以来,BotOrNot 已经通过网站和 API 处理了超过一百万个请求。
Feb, 2016
社交媒体中出现了越来越多的机器人欺诈行为,研究者们开发了不同类型的人工智能工具,以帮助公众对抗这些欺诈行为,其中包括 Botometer 等常用的机器人检测工具。本文综述了机器人的不同类型、它们的影响以及检测方法,并通过对 Botometer 的案例研究,详细讨论了 AI 检测工具在人们中的使用,同时谈到了在机器学习方法和反机器人攻击之间的必要性和影响。
Jan, 2019
社交机器人在在线社交网络中扮演重要角色,最近生成式人工智能(GenAI)的进展使得社交机器人能够产生高度逼真且复杂的内容,模仿人类创造力。为了识别这些虚假内容并区分其生成者,对该问题的多种方法已经被提出,但这些解决方案的广泛评估尚未进行。为了解决这个问题,我们评估了一个基于文本的机器人检测器在一个有竞争环境下的行为,对不同类别的社交机器人进行了全面的评估,并展示了一些可以用于未来工作的成果。
May, 2024