Aug, 2020

为了娱乐和利益对语言模型进行特洛伊植入

TL;DR本研究旨在研究恶意预训练语言模型对 NLP 系统带来的安全威胁,通过 TROJAN-LM 攻击来实现 NLP 系统的误操作,并提供分析性证明及可能的对策。