Jun, 2024

利用同形异义字规避 AI 生成的内容检测器

TL;DR本研究通过分析同形异义字如何转移文本的记号化和标记的对数似然值,对比了现有大语言模型检测器在五个不同数据集上与同形异义字攻击的有效性,发现同形异义字攻击可以有效躲避现有的大语言模型检测器, 讨论了这些发现的影响以及可能的防御方法。