BotTriNet: 通过度量学习实现社交机器人检测的统一高效嵌入
本文通过采用双向 LSTM 循环神经网络来区分类别 Twitter 上的人类账户和垃圾邮件机器人账户,实现对无先验知识的 Twitter 账户进行检测,以及不需要任何手工特征设计,最终得到良好的实验结果。
Feb, 2020
该论文提出了一种基于深度神经网络的机器人检测方法,通过使用元数据并将其作为辅助输入,CNN 处理推文文本。同时,作者们提出了一种基于合成少数过抽样的技术,从少量已标记数据(大约 3000 个 sophisticated Twitter bots 的样例)生成适合深度 CNN 训练的大型标记数据集。作者还在账户级别的机器人检测中应用了相同的架构,并在保证小型和可解释特征,以及最小训练数据的情况下,实现了几乎完美的分类准确度。从仅一个推文中,我们的体系结构就可以实现高分类精度(AUC > 96%)将机器人与人类分开。
Feb, 2018
本论文从 Twitter 账号出发,提出了使用卷积神经网络的新型算法,将账号执行的操作序列转化为图片,并进行图像分类,从而进行 bot 检测。结果证实了该方法的有效性,因为它与现有技术处在同一水平,并在某些情况下更好。
Apr, 2023
早期检测社交垃圾机器人对于防范传播虚假信息和操控公众意见至关重要。本研究首次使用用户描述字段和图像,采用预训练的视觉模型以及 TwHIN-BERT 来获取文本和图像的表征,并提出了三种不同的融合方法进行多模态融合,并在 Cresci '17 数据集上进行了广泛实验,证明了我们方法在准确率上具有显著优势,达到了 99.98%。
Aug, 2023
本文提出了一个基于超过一千个公共数据和元数据特征的框架,用于检测 Twitter 上的社交媒体自主实体(即社交媒体机器人)。经测试,此框架能够与公开的 Twitter 机器人数据集高度契合,可以检测不同类型的机器人,如垃圾邮件发送者、自我推广者和使用连接应用程序发布内容的账户等,并且估计在活跃的 Twitter 账户中有 9% 至 15% 的机器人,机器人相互之间的交互关系有助于研究用于相互之间通信的转发和提到策略。
Mar, 2017
本文介绍了一种基于 BERT 的模型 MetricBERT,该模型通过学习嵌入文本并同时遵循传统的掩码语言任务,以在定义明确的相似度度量下进行。我们主要关注于推荐中的学习相似性的下游任务,表明 MetricBERT 在超越其他最先进的替代方法并取得显著优势方面出色地表现。此外,我们还发布了一个由领域专家制作的视频游戏描述数据集以及测试集的相似性注释。
Aug, 2022
MulBot 是一种基于多元时间序列(MTS)的无监督机器人检测器,利用 LSTM 自编码器处理多维时间特征并在编码表示上执行聚类以检测机器人行为。在检测和分离不同机器人网络的多类别分类任务中,MulBot 实现了 f1-score=0.96,并解决了监督机器人检测器通常存在的泛化不足问题。
Sep, 2022
本文研究了 Twitter 上的转推行为,提出了一种基于无监督特征提取和聚类的机器人检测技术(RTbust),利用该技术检测到两个之前未知的拥有数百个账户的活跃机器人网络。
Feb, 2019
提出了一种基于关系图卷积网络的 Twitter 机器人检测方法 BotRGCN,它通过构建由关注关系组成的异构图来解决社群挑战,并利用多模用户语义和属性信息来捕获具有多样化伪装的机器人,实验结果表明,BotRGCN 在基准测试 TwiBot-20 中的性能优于竞争方法。
Jun, 2021
研究为了解决检测新型社交机器人的验证问题,提出一种基于专用分类器的超级学习方法,该方法在新数据集中将 F1 分数提高了 56%,且新机器人行为可使用更少标记示例进行学习。
Jun, 2020