Dec, 2023

DeceptPrompt: 利用对抗性自然语言指令挖掘 LLM 驱动的代码生成

TL;DR通过引入 DeceptPrompt 算法,该论文针对大型语言模型在代码生成任务中的致命弱点进行了广泛实验和分析,证实了其在诱导模型生成易受攻击代码方面的有效性,攻击成功率相比无前缀 / 后缀应用平均提高了 50%。