Jan, 2024

L-AutoDA: 利用大型语言模型进行自动化的基于决策的对抗攻击

TL;DR在机器学习快速发展的领域中,对抗性攻击对模型的稳健性和安全性构成了重大挑战。本研究引入了 L-AutoDA(基于大型语言模型的自动化决策攻击),这是一种新颖的方法,利用大型语言模型的生成能力来自动设计这些攻击。通过与大型语言模型在进化框架中的迭代交互,L-AutoDA 能够高效地自动设计具有竞争力的攻击算法,减少了人力成本。我们在 CIFAR-10 数据集上展示了 L-AutoDA 的有效性,表现出较基准方法在成功率和计算效率方面的显著提升。我们的发现突显了语言模型作为对抗性攻击生成工具的潜力,并为开发稳健的人工智能系统提供了新的途径。