Constraint 2021: COVID-19 虚假新闻检测机器学习模型共享任务
本文介绍了我们的虚假新闻检测系统,它利用预训练的集成模型自动识别与 COVID-19 相关的推文是否为 “真实” 或 “虚假”,并通过引入基于用户名和链接域的启发式算法显著提高了准确率,达到了最先进的结果。
Jan, 2021
本文研究通过数据挖掘的角度对社交媒体上的假新闻进行自动检测,并用不同的文本分类算法在 Contraint@AAAI 2021 Covid-19 假新闻检测数据集上进行评估。通过使用卷积神经网络(CNN)、长短时记忆(LSTM)和双向编码器变换器(BERT)来进行分类,并评估了无标签 Covid 推文语料库中的无监督学习的重要性。最终结果在 Covid-19 假新闻检测数据集上表现出 98.41%的最佳准确性。
Jan, 2021
本文介绍了使用基于 Transformer 的 COVID-Twitter-BERT(CT-BERT)模型集合的方法来检测英文 COVID-19 虚假新闻的结果和表现。在约 166 个团队中,该方法在第一个共享任务的测试集上取得了最高的加权 F1 得分 98.69。
Dec, 2020
通过训练模型可以区分真假 COVID-19 相关的健康信息,并获得 98.64% 的高 F1 分数,该研究排名第二,距离第一名仅有 0.05 个百分点的微小差距。
Jan, 2021
为了抗击 COVID-19 疫情期间社交媒体上的虚假信息,本文提出两种方法,一是 fine-tuning transformers-based language models,二是通过 influence data cleansing 去除危险的训练实例。通过在两个 COVID-19 虚假新闻测试集上评估模型,我们强调了此任务的模型泛化能力的重要性。最终模型可以达到高性能和模型泛化性能的平衡。
Jan, 2021
研究者通过设计和应用不同的机器学习模型,在探测虚假新闻方面取得了进展,但现有研究对于快速变化的主题和领域特定词汇的虚假新闻重视不够。本文提出了在特定与 COVID-19 相关主题中进行三项虚假新闻检测任务的方法和结果,并试验了一组基于文本的模型,包括支持向量机、随机森林、BERT 和 RoBERTa。发现预训练转换器可以产生最佳的验证结果,但经过智能设计的随机初始化转换器也可以训练达到接近预训练转换器的准确度。
May, 2022
本文报告了一种基于 Transformer 模型(BERT、ALBERT 和 XLNET)的方法来分析 COVID-19 流行病期间社交媒体上共享信息的可靠性,以便快速检测假新闻,减少假信息的传播,该方法在 ConstraintAI 2021 共享任务 COVID19 Fake News Detection in English 中获得了 0.9855 的 f1 值,排名第 5。
Jan, 2021
本文介绍了 AAAI-2021 CONSTRAINT 共享任务中开发的系统,包括在英语中检测 COVID19 虚假新闻和在印地语中检测敌对帖子。该研究使用 SVM,CNN,BiLSTM 和 CNN+BiLSTM 等技术进行分类任务,结果表明 SVM 在使用 tf-idf 特征方面在 task-A 测试集上实现了最高的 94.39%加权 $f_1$ 分数。标签功率集 SVM 使用 n-gram 特征在 task-B 测试集上获得了 86.03%的粗分类和 50.98%的细分类 $f_1$ 分数。
Jan, 2021
本文介绍了一种新颖的方法,该方法是由我们团队提出的,用于将来自 Latent Dirichlet Allocation(LDA)的主题分布与来自 XLNet 的情境表示相结合,用于 COVID19 假新闻检测的共享任务,并与基准线进行了比较,表明 XLNet + 主题分布通过获得 0.967 的 F1 分数而优于其他方法。
Jan, 2021
本篇研究提供了一种基于异构表征集成和神经网络分类算法的 COVID19 假新闻检测解决方案,并在共 168 个参赛作品中获得第 50 名,与最佳表现的解决方案相差不到 1.5%。
Jan, 2021