利用社交互动识别社交媒体上的错误信息
使用半监督学习框架来解决极度类别不平衡的问题,并使用实际数据扩充少数类别,该方法在处理社交媒体中极不平衡的发布单元时比 SMOTE、ADASYN、GAN 等其他方法效果显著提高,尤其在相关的 Covid 数据上初步测试表明有效性。
Apr, 2023
本研究提出一种基于新闻来源可信度标签的弱监督学习方法,通过自监督或重新标注等方式纠正可能存在的标签不准确性,构建大规模、多样化的新领域虚假信息数据集。同时,本文应用提出的方法提供了一个 COVID-19 疫苗虚假信息数据集。
Feb, 2022
该研究提出了一种基于人机交互的事实检查和追踪社交媒体信息违反相关政策的评估框架,采用现代化的自然语言处理方法和特定斯坦斯分类器通过提取和聚合结构化身份,鉴定和评估可能造成风险的要求,评估基于其潜在风险的全新误导的声明,为人机协助的事实检查提供了一个合理的基准。
Dec, 2022
社交媒体的兴起使得虚假新闻的广泛传播成为可能,而虚假新闻被故意发布以传播错误信息和影响人们的信仰。本文介绍了一种新的方法,通过人机交互的方式改善自动化系统对社交媒体的表示质量,在真实事件中实验表明,在少量人机交互之后,系统检测新闻可信度的性能得到了提升。
Sep, 2023
本文研究通过数据挖掘的角度对社交媒体上的假新闻进行自动检测,并用不同的文本分类算法在 Contraint@AAAI 2021 Covid-19 假新闻检测数据集上进行评估。通过使用卷积神经网络(CNN)、长短时记忆(LSTM)和双向编码器变换器(BERT)来进行分类,并评估了无标签 Covid 推文语料库中的无监督学习的重要性。最终结果在 Covid-19 假新闻检测数据集上表现出 98.41%的最佳准确性。
Jan, 2021
本研究提出了一种利用社交媒体上的弱标注信号并采用深度神经网络在元学习框架下结合少量干净数据进行训练,以提高虚假新闻的早期检测的方法,实验结果显示该方法可以有效地超越目前的最先进的基准线模型。
Apr, 2020
本文提出了一种基于信息困惑度的非监督式方法来辟谣虚假言论,该方法主要通过从科学和新闻来源中提取可靠证据,然后利用信息困惑度评估言论的正确性,在 COVID-19 相关测试集上进行实证验证,表现优于现有系统。
Jun, 2020
本文介绍了我们的虚假新闻检测系统,它利用预训练的集成模型自动识别与 COVID-19 相关的推文是否为 “真实” 或 “虚假”,并通过引入基于用户名和链接域的启发式算法显著提高了准确率,达到了最先进的结果。
Jan, 2021
本文提出了一种基于标记时间点过程的灵活表示方式,开发了一种可扩展的在线算法 Curb 来选择应该何时对故事进行事实核查以有效地减少假新闻和误导性信息的传播。
Nov, 2017
在社交媒体上,广泛传播的谣言对人们的日常生活产生了负面影响,导致公众潜在的恐慌、恐惧和心理健康问题。本文提出了一种新的检测模型,通过联合学习用户相关性和信息传播的表示来检测社交媒体上的谣言。评估结果表明,该模型在已有的谣言检测模型方面表现优秀,并且对抗性攻击更具鲁棒性。
Mar, 2024