学习历史,演化未来:预测时序趋势用于假新闻检测
社交媒体上的虚假新闻检测方法缺乏鲁棒性且无法推广到未知事件,为解决这一问题,该研究提出了一种面向未来事件的虚假新闻检测框架,通过自适应增强策略和图对比学习训练目标预测器,同时独立训练事件预测器并通过减去事件预测器的输出从而缓解事件偏见,实验证明了该方法在真实社交媒体环境下相对于现有的先进方法的有效性。
Feb, 2024
金融文本中存在时间数据分布的变化,如何在不稳定的市场环境中训练一个能够准确推断情感且对时间数据分布变化具有鲁棒性的金融情感分析系统?本文通过对跨越三年的真实金融社交媒体数据集进行经验研究,在时间数据分布变化的情况下分析金融情感分析系统的性能下降问题,并基于金融文本的独特时间性质提出了一种结合异常检测和时间序列建模的新方法用于时间金融情感分析。实验证明该方法增强了模型在波动的金融市场中适应不断变化的时间趋势的能力。
Oct, 2023
该研究探讨了虚假新闻检测中存在的实体偏差问题,并提出了一种基于因果图的实体去偏方法(ENDEF),通过消除实体偏差从而提高模型的泛化能力,实验证明该方法可以显著提高虚假新闻检测器的性能。
Apr, 2022
通过自然语言处理和机器学习技术,我们提出一种能够在语篇层面检测金融相关新闻时态性的新系统,利用了句法和语义依赖等复杂特征,从而提取主要陈述的主导时态。实验结果表明,与一种基于规则的替代方法相比,该系统具有较高的检测精确度,最终有助于发掘金融决策的预测性知识。
Mar, 2024
为了解决当今科技驱动的世界中虚假新闻(尤其是在选举等关键事件期间)的快速传播给信息的完整性带来的日益威胁,我们引入了 FakeWatch,一个全面的框架,旨在有效检测虚假新闻。通过利用一个新的精选北美选举相关新闻文章的数据集,我们构建了强大的分类模型。我们的框架融合了传统机器学习技术和尖端语言模型,以有效区分虚假新闻。我们的总体目标是为研究社区提供适应不断演变的误导信息领域的可调整和精确的分类模型。对我们的数据集上的虚假新闻分类器的定量评估表明,虽然最先进的语言模型略优于传统机器学习模型,由于其准确性和计算效率的平衡,传统模型仍然具有竞争力。此外,定性分析揭示了虚假新闻文章中的模式。这项研究为未来旨在打击误导信息(尤其是有关选举过程的信息)的努力奠定了基础。我们公开提供了我们的标记数据和模型以供使用和可复制性检验。
Mar, 2024
我们使用自然语言处理方法对 1876 条新闻数据进行预处理,通过训练模型将假新闻和真实新闻进行分类,最终通过 Naive Bayes 分类器得出 56% 的准确率和平均 32% 的 F1-macro 得分。
Sep, 2023
CounterfacTS 是一个用于通过反事实来探测深度学习模型在时间序列预测任务中的鲁棒性的工具,具有用户友好的界面,可视化、比较和量化时间序列数据及其预测结果,并允许用户以可解释的方式应用各种转换探索预测的变化。通过示例案例,我们说明了 CounterfacTS 如何用于识别时间序列集合的主要特征、评估模型性能的依赖性以及指导转换原始时间序列以创建具有期望属性的反事实,从而提高在数据分布的新区域中的预测性能,并讨论了在转换时间序列和创建有效的反事实时可视化和考虑数据在投影特征空间中的位置的重要性。总体而言,CounterfacTS 有助于创建反事实,以高效地探索原始数据未涵盖的假设情景对于时间序列预测任务的影响。
Mar, 2024
本文提出了事实持续时间预测来缓解时间错位带来的影响,在实验中演示了确定容易变化的事实,可以帮助模型避免重复过时信息,同时在知识密集型任务下建模事实持续时间有助于提高校准性。
May, 2023
本文研究了 Twitter 上由俄罗斯入侵乌克兰引起的信息趋势,考虑了不同方法用于分析新闻趋势,分析了深层学习用于假新闻检测,使用频繁项集和关联规则理论和图论进行新闻趋势分析。
Apr, 2022
本研究使用空间时间残差网络预测了洛杉矶不同区域在小时层面的犯罪分布情况,通过和其他预测方法的比较证明了其更高的准确度,并提出使用三值化技术解决实际资源短缺的问题。
Nov, 2017