Jun, 2024

对抗风格扩充的大型语言模型用于鲁棒假新闻检测

TL;DR通过使用 LLMs 自动生成各种具有多样性但连贯的风格转换攻击提示,我们的对抗性样式增强模型(AdStyle)改善了对假新闻的检测性能,并提高了鲁棒性。