基于深度上下文嵌入模型的阿拉伯语假新闻检测
本文利用几何深度学习模型对推特上的新闻内容、用户画像、行为,社交网络结构与传播进行深度融合,基于传播模式的方法可以高效地提取特征,提高了对于虚假新闻的识别率,在短时间内便可可靠地便可侦测出,同时与现存的基于内容分析的方法有互补性和多个优势。
Feb, 2019
提出了一个以理论驱动的模型,探索了假新闻在不同层次(词汇、句法、语义和话语)上的表现,并在监督式机器学习框架下进行了检测。在真实世界的两个数据集上的实验证明,该方法可以优于现有技术,并在内容信息有限的情况下实现假新闻的早期检测。
Apr, 2019
本论文提出了一种利用真实新闻和POS标注生成阿拉伯语虚假新闻的新方法,并开发了第一届阿拉伯语虚假新闻检测模型,该模型通过使用基于AraNews的生成式新闻实现了最新的F1=70.06的结果,所有研究中使用的数据和模型都是公开可用的。
Nov, 2020
本文研究通过数据挖掘的角度对社交媒体上的假新闻进行自动检测,并用不同的文本分类算法在Contraint@AAAI 2021 Covid-19假新闻检测数据集上进行评估。通过使用卷积神经网络(CNN)、长短时记忆(LSTM)和双向编码器变换器(BERT)来进行分类,并评估了无标签Covid推文语料库中的无监督学习的重要性。最终结果在Covid-19假新闻检测数据集上表现出98.41%的最佳准确性。
Jan, 2021
本文提出了一种基于变压器的语言模型微调方法,用于检测COVID-19假新闻,该方法通过扩展专业短语的语义,适应热身softmax损失以区分硬挖掘样本,并通过对抗性训练提高模型的鲁棒性,采用RoBERTa和领域专用模型CT-BERT提取预测特征,并由一个多层感知器融合细粒度和高级别的特定表示。经COVID-19假新闻数据集评估,实验结果在各种评估指标上都表现优越,最好的加权平均F1得分为99.02%。
Jan, 2021
该研究研究了推特阿拉伯语内容中的虚假信息,并使用传统和深度机器学习模型检测了 COVID-19 的虚假信息,结果表明优化 AUC 可以提高模型性能,而 XGBoost 可以最准确地检测 COVID-19 的虚假信息。
Jan, 2021
本文介绍了一种新颖的方法,该方法是由我们团队提出的,用于将来自Latent Dirichlet Allocation(LDA)的主题分布与来自XLNet的情境表示相结合,用于COVID19假新闻检测的共享任务,并与基准线进行了比较,表明XLNet +主题分布通过获得0.967的F1分数而优于其他方法。
Jan, 2021
本研究提出了一个有效的无监督框架,用于利用社交媒体中四种信息类型的知识,从而检测COVID-19相关新闻中的虚假信息。该框架使用一个强大的噪声鲁棒的自监督学习技术和一种新颖的数据集构建技术来提高检测性能,并在现有的标记数据集上取得了显著改进。
May, 2023