COVID-VTS:短视频平台上的事实抽取和验证
该研究探讨了利用多模式特征融合和引入外部知识来检测短视频假消息的方法,包括数据集构建,多模式谣言检测模型和对比学习技术,并在实际应用场景中发挥作用。
Apr, 2023
本研究提出了两种新方法:对比学习和掩码语言建模,以检测短视频社交媒体帖子中的语义不一致性,证明这些方法优于当前的最先进方法,可用于检测社交媒体帖子中的错误信息。
Feb, 2022
社交媒体的迅速增长导致虚假新闻泛滥,因此自动检测和验证虚假信息的研究变得尤为重要。本研究介绍了 Factify 2 任务的结果,提供了一个多模态事实验证和讽刺新闻数据集,并使用基于多模态关系将社交媒体索求与支持文件进行比较,最终得到 81.82% 的最高 F1 分数。
Jul, 2023
本研究介绍 CovidMis20 数据集,该数据集收集了从 2020 年 2 月到 7 月期间 1,375,592 条推文,用于利用基于深度学习的 Bi-LSTM 和集成 CNN + Bi-GRU 的方法进行假新闻检测,后者的测试精度优于前者。
Sep, 2022
研究者通过设计和应用不同的机器学习模型,在探测虚假新闻方面取得了进展,但现有研究对于快速变化的主题和领域特定词汇的虚假新闻重视不够。本文提出了在特定与 COVID-19 相关主题中进行三项虚假新闻检测任务的方法和结果,并试验了一组基于文本的模型,包括支持向量机、随机森林、BERT 和 RoBERTa。发现预训练转换器可以产生最佳的验证结果,但经过智能设计的随机初始化转换器也可以训练达到接近预训练转换器的准确度。
May, 2022
本文报告了一种基于 Transformer 模型(BERT、ALBERT 和 XLNET)的方法来分析 COVID-19 流行病期间社交媒体上共享信息的可靠性,以便快速检测假新闻,减少假信息的传播,该方法在 ConstraintAI 2021 共享任务 COVID19 Fake News Detection in English 中获得了 0.9855 的 f1 值,排名第 5。
Jan, 2021
本文提出了 Claim Span Identification (CSI) 任务并引入了名为 CURT 的大规模 Twitter 语料库,通过基于 RoBERTa 的适配器 DABERTa 进行实验来对其数据进行基准测试,并提供了细致的误差分析和消融研究来验证该模型的性能,并提供了全面的跨度注释指南以供公共使用。
Oct, 2022
为了在新冠疫情期间快速检测和减轻假新闻的传播,我们开发了一种基于机器学习自然语言处理模型的两阶段自动化检测流程来检测 COVID-19 假新闻,其中第一模型利用了基于事实检查的算法,通过检索特定 COVID-19 索赔的相关事实,第二模型通过计算索赔和手动策划的 COVID-19 数据集中检索到的真实事实之间的文本蕴含程度来验证索赔的真实程度。
Nov, 2020
本研究为 Constraint 2021 年 COVID-19 虚假新闻检测共享任务做出了贡献,提出了将经典机器学习算法与语言学特征相结合的方法,在数据预处理方面进行了多种尝试并得到了不错的结果。通过使用线性支持向量机算法,在测试数据上获得了 95.19% 的加权平均 F1 得分,名列排行榜第 80 位。
Jan, 2021
介绍了一种新的视频分类方法,通过利用视频转录的文本内容将传统的视频分类任务转化为文本分类任务,并应用迁移学习中的精调和少样本学习方法,通过对 YouTube 的虚假信息视频、伪科学视频以及假新闻数据集的评估,证明了该方法在识别验证信息和误导信息方面的效果。
Jul, 2023