社交媒体中的 COVID-19 虚假新闻识别
本文介绍了我们的虚假新闻检测系统,它利用预训练的集成模型自动识别与 COVID-19 相关的推文是否为 “真实” 或 “虚假”,并通过引入基于用户名和链接域的启发式算法显著提高了准确率,达到了最先进的结果。
Jan, 2021
为了抗击 COVID-19 疫情期间社交媒体上的虚假信息,本文提出两种方法,一是 fine-tuning transformers-based language models,二是通过 influence data cleansing 去除危险的训练实例。通过在两个 COVID-19 虚假新闻测试集上评估模型,我们强调了此任务的模型泛化能力的重要性。最终模型可以达到高性能和模型泛化性能的平衡。
Jan, 2021
本研究为 Constraint 2021 年 COVID-19 虚假新闻检测共享任务做出了贡献,提出了将经典机器学习算法与语言学特征相结合的方法,在数据预处理方面进行了多种尝试并得到了不错的结果。通过使用线性支持向量机算法,在测试数据上获得了 95.19% 的加权平均 F1 得分,名列排行榜第 80 位。
Jan, 2021
本文报告了一种基于 Transformer 模型(BERT、ALBERT 和 XLNET)的方法来分析 COVID-19 流行病期间社交媒体上共享信息的可靠性,以便快速检测假新闻,减少假信息的传播,该方法在 ConstraintAI 2021 共享任务 COVID19 Fake News Detection in English 中获得了 0.9855 的 f1 值,排名第 5。
Jan, 2021
本研究通过人工确认 10,700 个社交媒体帖子和文章的真假,并使用决策树、逻辑回归、梯度提升和支持向量机 (SVM) 等四种机器学习方法将其进行基准测试。结果表明,使用 SVM 可以获得最佳性能,F1-score 为 93.46%。研究样本涉及 COVID-19 疫情下社交媒体中的假新闻和谣言。
Nov, 2020
本文研究通过数据挖掘的角度对社交媒体上的假新闻进行自动检测,并用不同的文本分类算法在 Contraint@AAAI 2021 Covid-19 假新闻检测数据集上进行评估。通过使用卷积神经网络(CNN)、长短时记忆(LSTM)和双向编码器变换器(BERT)来进行分类,并评估了无标签 Covid 推文语料库中的无监督学习的重要性。最终结果在 Covid-19 假新闻检测数据集上表现出 98.41%的最佳准确性。
Jan, 2021
在 COVID-19 期间,社交媒体上的虚假信息泛滥,本研究针对巴西的事实核查机构使用一种 Markov-based 的计算方法来识别推文的话题,并揭示了这些机构揭穿的话题在政治和健康危机之间复杂交织的关系。
Dec, 2020
本研究介绍 CovidMis20 数据集,该数据集收集了从 2020 年 2 月到 7 月期间 1,375,592 条推文,用于利用基于深度学习的 Bi-LSTM 和集成 CNN + Bi-GRU 的方法进行假新闻检测,后者的测试精度优于前者。
Sep, 2022
本篇研究提供了一种基于异构表征集成和神经网络分类算法的 COVID19 假新闻检测解决方案,并在共 168 个参赛作品中获得第 50 名,与最佳表现的解决方案相差不到 1.5%。
Jan, 2021