仅凭名称便可检测和标识机器人
本文提出了一个基于超过一千个公共数据和元数据特征的框架,用于检测 Twitter 上的社交媒体自主实体(即社交媒体机器人)。经测试,此框架能够与公开的 Twitter 机器人数据集高度契合,可以检测不同类型的机器人,如垃圾邮件发送者、自我推广者和使用连接应用程序发布内容的账户等,并且估计在活跃的 Twitter 账户中有 9% 至 15% 的机器人,机器人相互之间的交互关系有助于研究用于相互之间通信的转发和提到策略。
Mar, 2017
该论文提出了一种基于深度神经网络的机器人检测方法,通过使用元数据并将其作为辅助输入,CNN 处理推文文本。同时,作者们提出了一种基于合成少数过抽样的技术,从少量已标记数据(大约 3000 个 sophisticated Twitter bots 的样例)生成适合深度 CNN 训练的大型标记数据集。作者还在账户级别的机器人检测中应用了相同的架构,并在保证小型和可解释特征,以及最小训练数据的情况下,实现了几乎完美的分类准确度。从仅一个推文中,我们的体系结构就可以实现高分类精度(AUC > 96%)将机器人与人类分开。
Feb, 2018
通过机器学习模型,利用推文文本中提取的用户资料来检测社交机器人(social bots)的研究,其主要贡献为提出一种利用个人信息相似性来区分社交机器人和人类用户的新模型,并创建了一个包含 6900 个 Twitter 账户资料的公共数据集。
Mar, 2022
本论文从 Twitter 账号出发,提出了使用卷积神经网络的新型算法,将账号执行的操作序列转化为图片,并进行图像分类,从而进行 bot 检测。结果证实了该方法的有效性,因为它与现有技术处在同一水平,并在某些情况下更好。
Apr, 2023
本研究提出一种基于最少账户元数据的框架,实现了对 Twitter 公共推文全量实时分析的高效和可靠的社交机器人分类,通过对训练和验证的大量数据集进行严格的验证系统,找到了挑选子集进行训练的方式比全量训练更好的模型精度和泛化性。
Nov, 2019
本文探究社交机器人与真实账户之间的语言差异,提出的词汇丰富度、词汇复杂度和表情符号分布等识别特征,可以有效地用于机器学习模型的训练和社交机器人识别。
Dec, 2018
社交媒体中出现了越来越多的机器人欺诈行为,研究者们开发了不同类型的人工智能工具,以帮助公众对抗这些欺诈行为,其中包括 Botometer 等常用的机器人检测工具。本文综述了机器人的不同类型、它们的影响以及检测方法,并通过对 Botometer 的案例研究,详细讨论了 AI 检测工具在人们中的使用,同时谈到了在机器学习方法和反机器人攻击之间的必要性和影响。
Jan, 2019
研究为了解决检测新型社交机器人的验证问题,提出一种基于专用分类器的超级学习方法,该方法在新数据集中将 F1 分数提高了 56%,且新机器人行为可使用更少标记示例进行学习。
Jun, 2020
通过对推特社交垃圾邮件的研究,发现社交垃圾邮件的崛起并不被 Twitter 和人类所能够准确检测,提出需要新的方法来解决这一问题,并且将对集体行为的分析作为一种新型的检测方式。
Jan, 2017
该研究采用基因算法综合当前最先进的社交机器人,通过操纵 Twitter 社交机器人的发展演变,提高社交机器人检测技术的有效性。结果表明,该方法逃避了当前的检测技术,但揭示了人们改进这些技术所需的要素。
Apr, 2019