使用机器学习自动识别灾难新闻以进行危机管理

Jan, 2023

使用机器学习自动识别灾难新闻以进行危机管理

Automated Identification of Disaster News For Crisis Management Using Machine Learning

Lord Christian Carl H. Regacho, Ai Matsushita, Angie M. Ceniza-Canillo

TL;DR研究使用机器学习算法 (逻辑回归，随机森林和多项式朴素贝叶斯) 和文本挖掘技术 (词袋，TF-IDF 和词形还原) 发展了一个可用于区分真假新闻的模型，并使用 160 个数据集进行了训练和测试，在使用这些技术的情况下，识别出具有 91.07% 的准确度。

Abstract

A lot of news sources picked up on Typhoon Rai (also known locally as Typhoon Odette), along with fake news outlets. The study honed in on the issue, to create a model that can identify between legitimate and illegitimate news articles. With this in mind, we chose the following

fake news machine learning logistic regression random forest multinomial naive bayes

发现论文，激发创造

使用多项式朴素贝叶斯算法和词项频率 - 逆文档频率（TF-IDF 向量化）检查菲律宾新闻推文的可信度

利用基于地面真值注释和 TF-IDF 作为特征提取的新闻文章作为训练数据集的研究表明，使用 Multinomial Naive Bayes 的模型在训练中的准确率为 99.46％，在预测未见数据时为 88.98％；但其在将假新闻标记为真实新闻方面的问题需要进一步研究，提高语料库收集，并使用集成机器学习来加强预测的建议。

May, 2023

基于机器学习技术的假新闻检测

我们使用自然语言处理方法对 1876 条新闻数据进行预处理，通过训练模型将假新闻和真实新闻进行分类，最终通过 Naive Bayes 分类器得出 56% 的准确率和平均 32% 的 F1-macro 得分。

Sep, 2023

运用自然语言处理和机器学习开发伪新闻模型

通过机器学习算法，在两个公开数据集上进行实验分析，研究了如何检测和区分真假新闻，结果表明采用了三种分类器：被动型侵略性、朴素贝叶斯和支持向量机，这种方法具有良好的性能表现。

Jan, 2022

Constraint 2021: COVID-19 虚假新闻检测机器学习模型共享任务

本研究为 Constraint 2021 年 COVID-19 虚假新闻检测共享任务做出了贡献，提出了将经典机器学习算法与语言学特征相结合的方法，在数据预处理方面进行了多种尝试并得到了不错的结果。通过使用线性支持向量机算法，在测试数据上获得了 95.19% 的加权平均 F1 得分，名列排行榜第 80 位。

Jan, 2021

使用 Transformer 和 TF-IDF 检测 COVID-19 阴谋论

研究者通过设计和应用不同的机器学习模型，在探测虚假新闻方面取得了进展，但现有研究对于快速变化的主题和领域特定词汇的虚假新闻重视不够。本文提出了在特定与 COVID-19 相关主题中进行三项虚假新闻检测任务的方法和结果，并试验了一组基于文本的模型，包括支持向量机、随机森林、BERT 和 RoBERTa。发现预训练转换器可以产生最佳的验证结果，但经过智能设计的随机初始化转换器也可以训练达到接近预训练转换器的准确度。

May, 2022

使用可靠来源的交叉检查实现自动假新闻检测

本研究利用自然语言处理和机器学习技术，开发出一种自动化检测虚假新闻的方法，该方法能够对推特上发布的内容进行检测，从可靠的新闻机构中获取相关信息，并使用随机森林模型进行分类，取得了 70％的准确率，这为虚假新闻检测提供了一种更加敏感和自然的方法。

Jan, 2022

利用不同模型进行虚假信息检测

本研究旨在探索开发虚假新闻检测模型的不同模型，使用机器学习算法和预训练算法如 TFIDF、CV 和 W2V 作为特征，处理文本数据。

Feb, 2020

SOTA 假新闻检测器的准确度如何

机器学习自动检测假新闻可以在其获得大量点击前阻止虚假陈述的传播。我们评估传统模型和最新开发的大型语言模型的鲁棒性，以判断它们在实际环境中的表现。我们发现，与最近开发的大型语言模型相比，传统模型较好地适应了在训练时所使用的数据分布之外的数据，但最佳模型的选择可能取决于具体任务。

Aug, 2023

自动检测虚假新闻的深度学习方法

提出了两种基于深度学习的模型，用于在多个领域的在线新闻内容中解决虚假新闻检测问题，并在 FakeNews AMT 和 Celebrity 两个数据集上评估，取得了很好的性能并超过了当前最先进的基于手工特征工程的系统。同时，进行了跨领域分析以探索系统在不同领域的适用性。

May, 2020

利用机器学习提高台湾泥石流疏散警报

研究通过使用机器学习模型，利用历史雨量数据对泥石流进行预测，并探究了错报和漏报之间的权衡，发现在台湾现有的泥石流预警系统中采用随机森林模型可有效减少错误预警，提高预警的精度。

Aug, 2022