COLINGApr, 2024

简单变得更难:LLMs 在简化语料库上表现出一致的行为吗?

TL;DR简化文本以提高阅读能力,保留原始内容和意义。通过比较预训练分类器在原始和简化输入上的预测,研究发现所有语言和模型之间存在令人担忧的不一致性,简化输入很容易被利用来进行零迭代、与模型无关的对抗攻击,成功率可达 50%。