Constraint 2021: COVID-19 虚假新闻检测机器学习模型共享任务

AAAIJan, 2021

Constraint 2021: COVID-19 虚假新闻检测机器学习模型共享任务

Constraint 2021: Machine Learning Models for COVID-19 Fake News Detection Shared Task

Thomas Felber

TL;DR本研究为 Constraint 2021 年 COVID-19 虚假新闻检测共享任务做出了贡献，提出了将经典机器学习算法与语言学特征相结合的方法，在数据预处理方面进行了多种尝试并得到了不错的结果。通过使用线性支持向量机算法，在测试数据上获得了 95.19% 的加权平均 F1 得分，名列排行榜第 80 位。

Abstract

In this system paper we present our contribution to the Constraint 2021 covid-19 fake news detection Shared Task, which poses the challenge of classifying →

covid-19 fake news detection machine learning linguistic features linear svm

发现论文，激发创造

一种启发式驱动的集成框架用于 COVID-19 假新闻检测

本文介绍了我们的虚假新闻检测系统，它利用预训练的集成模型自动识别与 COVID-19 相关的推文是否为 “真实” 或 “虚假”，并通过引入基于用户名和链接域的启发式算法显著提高了准确率，达到了最先进的结果。

Jan, 2021

评估深度学习方法用于 Covid19 虚假新闻检测

本文研究通过数据挖掘的角度对社交媒体上的假新闻进行自动检测，并用不同的文本分类算法在 Contraint@AAAI 2021 Covid-19 假新闻检测数据集上进行评估。通过使用卷积神经网络（CNN）、长短时记忆（LSTM）和双向编码器变换器（BERT）来进行分类，并评估了无标签 Covid 推文语料库中的无监督学习的重要性。最终结果在 Covid-19 假新闻检测数据集上表现出 98.41％的最佳准确性。

Jan, 2021

利用 CT-BERT 和集成学习进行 COVID-19 虚假新闻检测在 Constraint@AAAI2021 上的 g2tmn

本文介绍了使用基于 Transformer 的 COVID-Twitter-BERT（CT-BERT）模型集合的方法来检测英文 COVID-19 虚假新闻的结果和表现。在约 166 个团队中，该方法在第一个共享任务的测试集上取得了最高的加权 F1 得分 98.69。

Dec, 2020

社交媒体中的 COVID-19 虚假新闻识别

通过训练模型可以区分真假 COVID-19 相关的健康信息，并获得 98.64% 的高 F1 分数，该研究排名第二，距离第一名仅有 0.05 个百分点的微小差距。

Jan, 2021

COVID-19 假新闻检测模型的泛化能力

为了抗击 COVID-19 疫情期间社交媒体上的虚假信息，本文提出两种方法，一是 fine-tuning transformers-based language models，二是通过 influence data cleansing 去除危险的训练实例。通过在两个 COVID-19 虚假新闻测试集上评估模型，我们强调了此任务的模型泛化能力的重要性。最终模型可以达到高性能和模型泛化性能的平衡。

Jan, 2021

使用 Transformer 和 TF-IDF 检测 COVID-19 阴谋论

研究者通过设计和应用不同的机器学习模型，在探测虚假新闻方面取得了进展，但现有研究对于快速变化的主题和领域特定词汇的虚假新闻重视不够。本文提出了在特定与 COVID-19 相关主题中进行三项虚假新闻检测任务的方法和结果，并试验了一组基于文本的模型，包括支持向量机、随机森林、BERT 和 RoBERTa。发现预训练转换器可以产生最佳的验证结果，但经过智能设计的随机初始化转换器也可以训练达到接近预训练转换器的准确度。

May, 2022

基于 Transformer 的自动 COVID-19 假新闻检测系统

本文报告了一种基于 Transformer 模型（BERT、ALBERT 和 XLNET）的方法来分析 COVID-19 流行病期间社交媒体上共享信息的可靠性，以便快速检测假新闻，减少假信息的传播，该方法在 ConstraintAI 2021 共享任务 COVID19 Fake News Detection in English 中获得了 0.9855 的 f1 值，排名第 5。

Jan, 2021

应对敌对行为：社交媒体中的 Covid-19 虚假新闻和敌对帖子检测

本文介绍了 AAAI-2021 CONSTRAINT 共享任务中开发的系统，包括在英语中检测 COVID19 虚假新闻和在印地语中检测敌对帖子。该研究使用 SVM，CNN，BiLSTM 和 CNN+BiLSTM 等技术进行分类任务，结果表明 SVM 在使用 tf-idf 特征方面在 task-A 测试集上实现了最高的 94.39％加权 $f_1$ 分数。标签功率集 SVM 使用 n-gram 特征在 task-B 测试集上获得了 86.03％的粗分类和 50.98％的细分类 $f_1$ 分数。

Jan, 2021

使用 XLNet 模型和主题分布的假新闻检测系统: CONSTRAINT@AAAI2021 共享任务

本文介绍了一种新颖的方法，该方法是由我们团队提出的，用于将来自 Latent Dirichlet Allocation（LDA）的主题分布与来自 XLNet 的情境表示相结合，用于 COVID19 假新闻检测的共享任务，并与基准线进行了比较，表明 XLNet + 主题分布通过获得 0.967 的 F1 分数而优于其他方法。

Jan, 2021

利用神经堆叠技术识别与 COVID-19 有关的虚假新闻

本篇研究提供了一种基于异构表征集成和神经网络分类算法的 COVID19 假新闻检测解决方案，并在共 168 个参赛作品中获得第 50 名，与最佳表现的解决方案相差不到 1.5%。

Jan, 2021