Oct, 2023

对大规模语言模型的漏洞调查:对抗性攻击的揭示

TL;DR大型语言模型的安全性评估和对抗攻击是一个新兴的跨学科领域,本文调查了该领域的相关研究,并提供了对大型语言模型、安全对抗、漏洞源及潜在防御措施的综述。