Nov, 2023

转置攻击:通过双向训练窃取数据集

TL;DR神经网络存在漏洞可在双向上执行不同任务的训练,导致对抗者能够将恶意模型隐藏在表面上合法的模型中,此外神经网络还能被教导有系统地记忆和检索特定样本,这些发现展示了一种对抗者能够在受保护的学习环境中以合法模型的假象下窃取数据集的新方法,我们通过重点研究数据窃取攻击表明现代架构可以偷偷窃取数以万计的高保真样本,足以危害数据隐私甚至训练新模型,为了减轻这一威胁,我们提出了一种检测感染模型的新方法。