使用机器学习自动识别灾难新闻以进行危机管理
利用基于地面真值注释和 TF-IDF 作为特征提取的新闻文章作为训练数据集的研究表明,使用 Multinomial Naive Bayes 的模型在训练中的准确率为 99.46%,在预测未见数据时为 88.98%;但其在将假新闻标记为真实新闻方面的问题需要进一步研究,提高语料库收集,并使用集成机器学习来加强预测的建议。
May, 2023
我们使用自然语言处理方法对 1876 条新闻数据进行预处理,通过训练模型将假新闻和真实新闻进行分类,最终通过 Naive Bayes 分类器得出 56% 的准确率和平均 32% 的 F1-macro 得分。
Sep, 2023
通过机器学习算法,在两个公开数据集上进行实验分析,研究了如何检测和区分真假新闻,结果表明采用了三种分类器:被动型侵略性、朴素贝叶斯和支持向量机,这种方法具有良好的性能表现。
Jan, 2022
本研究为 Constraint 2021 年 COVID-19 虚假新闻检测共享任务做出了贡献,提出了将经典机器学习算法与语言学特征相结合的方法,在数据预处理方面进行了多种尝试并得到了不错的结果。通过使用线性支持向量机算法,在测试数据上获得了 95.19% 的加权平均 F1 得分,名列排行榜第 80 位。
Jan, 2021
研究者通过设计和应用不同的机器学习模型,在探测虚假新闻方面取得了进展,但现有研究对于快速变化的主题和领域特定词汇的虚假新闻重视不够。本文提出了在特定与 COVID-19 相关主题中进行三项虚假新闻检测任务的方法和结果,并试验了一组基于文本的模型,包括支持向量机、随机森林、BERT 和 RoBERTa。发现预训练转换器可以产生最佳的验证结果,但经过智能设计的随机初始化转换器也可以训练达到接近预训练转换器的准确度。
May, 2022
本研究利用自然语言处理和机器学习技术,开发出一种自动化检测虚假新闻的方法,该方法能够对推特上发布的内容进行检测,从可靠的新闻机构中获取相关信息,并使用随机森林模型进行分类,取得了 70%的准确率, 这为虚假新闻检测提供了一种更加敏感和自然的方法。
Jan, 2022
机器学习自动检测假新闻可以在其获得大量点击前阻止虚假陈述的传播。我们评估传统模型和最新开发的大型语言模型的鲁棒性,以判断它们在实际环境中的表现。我们发现,与最近开发的大型语言模型相比,传统模型较好地适应了在训练时所使用的数据分布之外的数据,但最佳模型的选择可能取决于具体任务。
Aug, 2023
提出了两种基于深度学习的模型,用于在多个领域的在线新闻内容中解决虚假新闻检测问题,并在 FakeNews AMT 和 Celebrity 两个数据集上评估,取得了很好的性能并超过了当前最先进的基于手工特征工程的系统。同时,进行了跨领域分析以探索系统在不同领域的适用性。
May, 2020
研究通过使用机器学习模型,利用历史雨量数据对泥石流进行预测,并探究了错报和漏报之间的权衡,发现在台湾现有的泥石流预警系统中采用随机森林模型可有效减少错误预警,提高预警的精度。
Aug, 2022