Nov, 2023

通过对抗性上下文学习劫持大型语言模型

TL;DR通过引入一种新的对上下文学习的颠覆性攻击方法,本文展示了一种能够利用 LMLs 来生成针对性响应的方法,并通过对各种任务和数据集的广泛实验结果证明了其有效性。