ACLSep, 2023

J-Guard: 以新闻引导的对抗鲁棒性检测人工智能生成的新闻

TL;DRAI 生成的新闻是网络上的重要的误信息来源,此研究开发了一个名为 J-Guard 的框架,通过应用独特的新闻特征来有效区分真实的新闻和 AI 生成的新闻,并在面对对抗性攻击时只有 7%的性能下降。