基于深度上下文嵌入模型的阿拉伯语假新闻检测

May, 2022

基于深度上下文嵌入模型的阿拉伯语假新闻检测

Arabic Fake News Detection Based on Deep Contextualized Embedding Models

Ali Bou Nassif, Ashraf Elnagar, Omar Elgendy, Yaman Afadar

TL;DR本文构建了一个大而多样的阿拉伯语假新闻数据集，并利用八种最先进的阿拉伯语上下文嵌入模型开发和评估了基于变换器的分类器，以识别假新闻，实验结果证实这些先进的模型具有鲁棒性，准确率超过98%。

Abstract

social media is becoming a source of news for many people due to its ease and freedom of use. As a result, fake news has been spreading quickly and easily regardless of its credibility, especially in the last dec

发现论文，激发创造

利用几何深度学习技术识别社交媒体上的虚假新闻

本文利用几何深度学习模型对推特上的新闻内容、用户画像、行为，社交网络结构与传播进行深度融合，基于传播模式的方法可以高效地提取特征，提高了对于虚假新闻的识别率，在短时间内便可可靠地便可侦测出，同时与现存的基于内容分析的方法有互补性和多个优势。

Feb, 2019

假新闻早期检测：一项跨学科研究

提出了一个以理论驱动的模型，探索了假新闻在不同层次（词汇、句法、语义和话语）上的表现，并在监督式机器学习框架下进行了检测。在真实世界的两个数据集上的实验证明，该方法可以优于现有技术，并在内容信息有限的情况下实现假新闻的早期检测。

Apr, 2019

生成和检测阿拉伯语操纵和虚假新闻的机器

本论文提出了一种利用真实新闻和POS标注生成阿拉伯语虚假新闻的新方法，并开发了第一届阿拉伯语虚假新闻检测模型，该模型通过使用基于AraNews的生成式新闻实现了最新的F1=70.06的结果，所有研究中使用的数据和模型都是公开可用的。

Nov, 2020

评估深度学习方法用于Covid19虚假新闻检测

本文研究通过数据挖掘的角度对社交媒体上的假新闻进行自动检测，并用不同的文本分类算法在Contraint@AAAI 2021 Covid-19假新闻检测数据集上进行评估。通过使用卷积神经网络（CNN）、长短时记忆（LSTM）和双向编码器变换器（BERT）来进行分类，并评估了无标签Covid推文语料库中的无监督学习的重要性。最终结果在Covid-19假新闻检测数据集上表现出98.41％的最佳准确性。

Jan, 2021

基于Transformer的语言模型微调方法在COVID-19假新闻检测中的应用

本文提出了一种基于变压器的语言模型微调方法，用于检测COVID-19假新闻，该方法通过扩展专业短语的语义，适应热身softmax损失以区分硬挖掘样本，并通过对抗性训练提高模型的鲁棒性，采用RoBERTa和领域专用模型CT-BERT提取预测特征，并由一个多层感知器融合细粒度和高级别的特定表示。经COVID-19假新闻数据集评估，实验结果在各种评估指标上都表现优越，最好的加权平均F1得分为99.02％。

Jan, 2021

食用大蒜可预防COVID-19感染：在Twitter阿拉伯内容中检测虚假信息

该研究研究了推特阿拉伯语内容中的虚假信息，并使用传统和深度机器学习模型检测了 COVID-19 的虚假信息，结果表明优化 AUC 可以提高模型性能，而 XGBoost 可以最准确地检测 COVID-19 的虚假信息。

Jan, 2021

使用XLNet模型和主题分布的假新闻检测系统: CONSTRAINT@AAAI2021共享任务

本文介绍了一种新颖的方法，该方法是由我们团队提出的，用于将来自Latent Dirichlet Allocation（LDA）的主题分布与来自XLNet的情境表示相结合，用于COVID19假新闻检测的共享任务，并与基准线进行了比较，表明XLNet +主题分布通过获得0.967的F1分数而优于其他方法。

Jan, 2021

嵌入式探测！使用文档嵌入式检测假新闻

本文提出了一种使用文档嵌入的新方法，建立多个模型，将新闻文章准确地标记为可靠或虚假，评估了这些模型并证明了文档编码是获得高准确性的最重要因素

Apr, 2023

基于多模态弱信号的无监督领域无关假新闻检测

本研究提出了一个有效的无监督框架，用于利用社交媒体中四种信息类型的知识，从而检测COVID-19相关新闻中的虚假信息。该框架使用一个强大的噪声鲁棒的自监督学习技术和一种新颖的数据集构建技术来提高检测性能，并在现有的标记数据集上取得了显著改进。

May, 2023

COVID-19 的假新闻检测与行为分析

本文通过深度学习和集成学习方法，成功识别出社交媒体上的假新闻，并且对其话题进行了研究，发现其中一半话题与真实新闻相同，可能会导致人们的混淆。

May, 2023