信息操纵检测中的挑战与机遇:战时俄罗斯媒体的考察
本研究使用新闻文章和 Telegram 新闻频道在乌克兰、俄罗斯、罗马尼亚和英语中分析了战争第一个月期间媒体对公众舆论的影响和反映,并提出并比较了两种基于 Transformer 和语言特征的多语言自动化亲俄罗斯宣传识别方法,分析了它们的优缺点,适用于新的流派和语言,并对其用于内容管理的道德问题进行了分析,旨在为针对当前冲突量身定制的管理工具的进一步发展奠定基础。
Jan, 2023
针对克里姆林宫的宣传活动,发展了首个支持 7 种语言的 NLP 增强的亲克里姆林宫宣传检测应用程序,该应用能够为普通用户提供新闻反馈、解释操纵性语言特征和关键词,并通过用户研究、模型行为分析以及问卷答案,调查了该解决方案的优势和劣势。
Jan, 2024
研究俄罗斯 Izvestia 报纸 13 年 (10 万篇文章) 的数据,发现文章在俄罗斯经济衰退后一个月内更多提及美国,呈现出有目的的偏向性,文章还探讨了策略性的议程设置和框架决策对媒体操纵的影响。
Aug, 2018
该论文提出了一个在社交媒体上识别新闻信息操纵的新任务,介绍了他们的数据收集方案和数据集 “ManiTweet”,并发现这是一项具有挑战性的任务,基于大型语言模型的表现仍然不尽完美。他们提出的简单且有效的基本模型在 ManiTweet 数据集上表现优异。此外,在一些人类编写的推文的探索性分析中揭示了有关信息操纵与新闻文章领域和事实性之间的有趣联系,并发现操纵的句子更有可能包含主要故事或后果。
May, 2023
通过逆强化学习方法研究了 2022 年俄罗斯入侵乌克兰的宣传策略,发现社交媒体上的在线讨论对俄罗斯宣传的传播起到战略性作用。
Jul, 2023
本文通过对 16 家俄罗斯媒体如何在 732 个 Telegram 渠道上进行互动和推广进行研究,使用 MPNet 模型嵌入文章和 Telegram 消息,并利用 DP-Means 聚类算法进行段落级别的主题 / 叙述提取和 Hawkes 时间序列分析,发现其内容中在 Telegram 上产生的活动占 2.3%-26.7% 不等,在跟踪一些特定叙述的传播途径时,测量了这些网站和渠道在俄罗斯媒体生态系统中传播内容的速度。
Jan, 2023
本文探讨了现有的假新闻检测方法存在的问题,并提出加入事实核查与语言分析相结合的方法,以应对新闻篡改攻击和真实新闻被误判的情况。作者提出采用众包知识图谱解决新闻事件事实搜集的问题。
Jan, 2019
本研究构建了一个新的数据集 MiDe-22,包括 5,284 条英文推文和 5,064 条土耳其推文,涵盖了包括俄罗斯 - 乌克兰战争、COVID-19 疫情和难民等几个最近事件,并提供了推文的用户参与度。研究提供了详细的数据分析和实验结果,并对误信息检测进行了基准评估。
Oct, 2022
本文研究了 Twitter 上由俄罗斯入侵乌克兰引起的信息趋势,考虑了不同方法用于分析新闻趋势,分析了深层学习用于假新闻检测,使用频繁项集和关联规则理论和图论进行新闻趋势分析。
Apr, 2022
互联网和社交媒体改变了人们在信息传播迅速的时代获取新闻的方式。虽然这种发展增加了信息的获取,但也带来了一个重大问题:假新闻和信息的传播。假新闻迅速在数字平台上传播,对媒体生态系统、公众舆论、决策和社会凝聚力产生了负面影响。自然语言处理(NLP)作为一种能够确定内容真伪的技术手段,在对抗虚假信息的战斗中崭露头角。本文深入探讨了 NLP 技术如何用于检测假新闻,并揭示了它所带来的挑战和机遇。
Aug, 2023