- FaKnow: 一种用于假新闻检测的统一库
本研究提出了 FaKnow,一个统一且全面的假新闻检测算法库,其中包括基于内容和社交环境两种常用的假新闻检测模型,有效地组织了数据、模型和训练过程,并提供可视化和日志等辅助功能和工具,同时为该领域的研究人员的努力做出了贡献。
- 针对假新闻检测的对抗性数据污染:如何使模型对目标新闻进行错误分类而不修改该新闻
在这篇立场论文中,我们分析了在不允许操纵原始目标新闻的情况下如何攻击在线学习检测器的性能,以及攻击者如何潜在地引入污染数据来操纵在线学习方法的行为。我们的初步研究发现,基于复杂性和攻击类型,逻辑回归模型对此具有不同的敏感性。
- GAMC: 使用图自编码器与掩码的无监督假新闻检测方法
利用图自动编码器与掩码和对比学习的 GAMC,一种无监督的假新闻检测技术,通过利用新闻传播的上下文和内容作为自监督信号,消除了对标记数据集的要求,并通过实验验证了方法的有效性。
- BanMANI:用于识别孟加拉社交媒体新闻操纵的数据集
本研究采用 BanMANI 数据集,旨在解决社交媒体新闻中虚假操纵相关新闻文章的具体声明在孟加拉语中尚未得到解决的问题。通过分析,我们发现这个任务无论是在零样本还是在微调设置下,都对当前 LLMs 构成了挑战。
- 适应大语言模型时代的假新闻检测
本文研究了大型语言模型时代中的假新闻检测问题,发现仅训练于人工编写文章的检测器在检测机器生成的假新闻方面表现良好,但反之不成立。此外,由于检测器对机器生成的文本存在偏见,需要在训练集中使用比测试集中较低比例的机器生成新闻。基于我们的发现,我 - 不良演员,良好顾问:大型语言模型在假新闻检测中的作用探究
基于大型语言模型的虚假新闻检测研究发现,大型语言模型虽然能提供多元的合理解释,却无法像基于小语言模型的训练过程那样适当选择和结合解释来得出结论。因此,当前的大型语言模型不能替代小型语言模型在虚假新闻检测中的作用,但可以作为小型语言模型的顾问 - 巴西葡萄牙语假新闻检测平台 Fake News BR
在这篇论文中,我们提供了一项关于检测巴西葡萄牙语伪新闻的综合研究,专注于新闻报道类型。我们提出了一种基于机器学习的方法,利用自然语言处理技术,包括 TF-IDF 和 Word2Vec,从文本数据中提取特征。我们评估了各种分类算法(如逻辑回归 - 利用精调的大型语言模型进行虚假信息和假新闻检测的分析
利用 PEFT/LoRA 的方法对 Llama 2 大型语言模型进行细调,以用于辨析虚假信息和检测假新闻。该研究中,模型被细调以完成以下任务:解析揭示虚假信息和宣传叙事的文本、事实核查、假新闻检测、操纵分析、提取带情感的命名实体。实验结果表 - SOTA 假新闻检测器的准确度如何
机器学习自动检测假新闻可以在其获得大量点击前阻止虚假陈述的传播。我们评估传统模型和最新开发的大型语言模型的鲁棒性,以判断它们在实际环境中的表现。我们发现,与最近开发的大型语言模型相比,传统模型较好地适应了在训练时所使用的数据分布之外的数据, - 从虚假新闻到极端党派新闻的检测:使用领域自适应技术
比较无监督领域自适应技术在两个文本分类任务(假新闻检测和偏激新闻检测)中的效果,并探讨了数据增强、聚类和主题建模与无监督领域自适应技术相结合对性能的提升。
- ACL学习历史,演化未来:预测时序趋势用于假新闻检测
本研究提出了一种名为 “FTT” 的有效框架,可以预测新闻数据的时间分布模式并指导检测器快速适应未来的分布。在真实世界的时序数据集上的实验证明了我们所提出的框架的优越性。
- 提高多模态假新闻检测的泛化能力
本文提出了三种基于多模态 transformer 的假新闻检测模型,并通过深入分析操纵数据的方法来探索这些模型在社交媒体上实际使用情况下的性能。研究发现,这些系统在面临被操纵的数据时会出现显著性能下降。为了减少偏差并改善模型的推广能力,本文 - 基于多模态弱信号的无监督领域无关假新闻检测
本研究提出了一个有效的无监督框架,用于利用社交媒体中四种信息类型的知识,从而检测 COVID-19 相关新闻中的虚假信息。该框架使用一个强大的噪声鲁棒的自监督学习技术和一种新颖的数据集构建技术来提高检测性能,并在现有的标记数据集上取得了显著 - 嵌入式探测!使用文档嵌入式检测假新闻
本文提出了一种使用文档嵌入的新方法,建立多个模型,将新闻文章准确地标记为可靠或虚假,评估了这些模型并证明了文档编码是获得高准确性的最重要因素
- 相似度感知的多模态提示学习用于假新闻检测
本篇研究提出了一个基于相似性感知的多模态提示学习框架 (SAMPLE) 用于检测假新闻,通过三种提示模板和一种软性描述器分析,并采用自适应融合方法来减少因不相关的交叉模态特征注入噪音,实验表明相较于先前方法,SAMPLE 在两个基准多模态数 - 基于多粒度信息融合的社交媒体多模态假新闻检测
文章介绍了一种用于检测假新闻的多粒度多模态融合网络模型,并将模型性能与现有方法进行了比较。
- 基于 BERT 模型的 COVID-19 相关推文的虚假新闻检测和情感分析
我们的团队 “techno” 参加了 CERIST'22 共享任务,利用自然语言处理工具和 BERT 预训练语言模型,对与 COVID-19 疫情有关的 4128 个推文进行了情感分析和 8661 个推文进行了虚假新闻检测任务,并获得了情感 - 无处可藏:双重深度交互通道网络基于数据增强用于假新闻检测
本篇论文提出了一种基于语义、情感和数据增强的小样本下假新闻检测方法,并引入情感演进模式和双深度交互通道网络,同时设计数据增强模块提高模型性能。实验证明该方法优于现有方法。
- MCWDST:一种用于社交媒体实时假新闻缓解的最小代价加权有向生成树算法
本研究提出了一种端到端解决方案,通过卷积和双向 LSTM 层提出两种新型深度学习架构来准确检测虚假新闻,并提供了一种实时的网络感知策略,以构建最小成本加权有向生成树来抑制虚假新闻的传播,并利用新型排名函数对这些节点进行免疫评分,实验在五个真 - 基于 XAI 模型的新型跨领域策略用于假新闻检测
本研究提出了一种四级跨域策略,通过使用来源域的知识,采用精细调整的 BERT 模型实现跨域分类,并使用 Anchor、ELI5、LIME 和 SHAP 等可解释模型来设计一种新的可解释跨域方法。经过实验分析,在不同跨域级别上很好地匹配了 X