Nov, 2023

神经文本检测器的高效黑盒对抗攻击

TL;DR通过调整参数、优化提示语和进行字符级别的变异,我们研究了改变 GPT-3.5 生成的文本的三种简单且资源高效的策略,这些策略在人类不会察觉但能使神经文本检测器误分类的文本中特别有效。