Dec, 2023

针对假新闻检测的对抗性数据污染:如何使模型对目标新闻进行错误分类而不修改该新闻

TL;DR在这篇立场论文中,我们分析了在不允许操纵原始目标新闻的情况下如何攻击在线学习检测器的性能,以及攻击者如何潜在地引入污染数据来操纵在线学习方法的行为。我们的初步研究发现,基于复杂性和攻击类型,逻辑回归模型对此具有不同的敏感性。