转置攻击：通过双向训练窃取数据集

Nov, 2023

转置攻击：通过双向训练窃取数据集

Transpose Attack: Stealing Datasets with Bidirectional Training

Guy Amit, Mosh Levy, Yisroel Mirsky

TL;DR神经网络存在漏洞可在双向上执行不同任务的训练，导致对抗者能够将恶意模型隐藏在表面上合法的模型中，此外神经网络还能被教导有系统地记忆和检索特定样本，这些发现展示了一种对抗者能够在受保护的学习环境中以合法模型的假象下窃取数据集的新方法，我们通过重点研究数据窃取攻击表明现代架构可以偷偷窃取数以万计的高保真样本，足以危害数据隐私甚至训练新模型，为了减轻这一威胁，我们提出了一种检测感染模型的新方法。

Abstract

deep neural networks are normally executed in the forward direction. However, in this work, we identify a vulnerability that enables models to be trained in both directions and on different tasks. →

deep neural networks vulnerability adversaries data exfiltration infected models

发现论文，激发创造

通过时间侧信道窃取神经网络

本文提出利用时间侧信道攻击来推断神经网络模型深度的黑盒神经网络提取攻击，使用知识蒸馏和强化学习，有效减少了搜索空间，可以构造出与目标模型测试精度接近的替代模型，且该方法可扩展，并与神经网络结构类型无关。

Dec, 2018

窃取隐形：通过对抗样本和时间侧信道揭示预训练的卷积神经网络模型

基于对对抗性图像分类模式的观察，我们提出一种用于盗取模型的方法，结合时间侧信道和对抗性图像分类，以指纹识别多个著名的卷积神经网络和 Vision Transformer 架构，该方法可在减少查询次数的同时保持高准确率。

Feb, 2024

部分训练和隔离：缓解后门攻击

观察了后门攻击的特点，本文提出了一种新的模型训练方法（PT），该方法通过冻结模型的一部分来训练能够隔离可疑样本的模型，然后在此基础上，对一个干净模型进行微调以抵抗后门攻击。

May, 2024

神秘揭露者：针对深度神经网络的生成模型反演攻击

本文介绍了一种新型攻击方法 —— 生成模型反演攻击，它可以显著地提高逆转深度神经网络的准确率，攻击者使用部分公共信息学习分布先验，引导逆转过程，并且通过实验证明了差分隐私在该攻击下的防御效果有限。

Nov, 2019

使用自适应虚假信息防御模型窃取攻击

该研究提出了采用自适应误导的方法抵御深度神经网络模型盗窃攻击，并针对现有所有模型盗窃攻击均使用 Out-Of-Distribution 输入进行了阐述，提出选择性错误预测的方法以显著降低攻击者克隆模型的准确率，同时最小化对良性用户准确率的影响，这种防御具有更好的安全性和准确度平衡，并且计算开销最小。

Nov, 2019

深入数据：有效替代式训练针对黑盒攻击

本文提出了一种新的替代训练视角，着重于设计在知识窃取过程中使用的数据分布，提出了多样化的数据生成模块来综合宽泛的分布的大规模数据，并引入对接近决策边界的数据进行对抗替换训练策略，两个模块的结合可以进一步提高替代模型和目标模型的一致性，大大提高了对抗攻击的有效性。

Apr, 2021

重新思考针对深度神经网络的数据可用性攻击

本文介绍了一种优化方法，可提高可用性攻击方法的效果，减少计算时间要求，以解决商业目的的个人数据的非授权使用和私人数据的暗地收集，同时避免了当前许多攻击方法被对抗性训练所削弱的问题。

May, 2023

数据高效后门攻击

本文提出了一种基于过滤和更新策略的深度神经网络反向攻击样本优化方法，从而提高了毒化数据的效率。通过在 CIFAR-10 和 ImageNet-10 数据集上的实验结果验证了该方法的有效性。

Apr, 2022

变分模型反演攻击

本研究提供了深度学习中一种重要的隐私保护策略，即基于变分自编码器和生成模型的攻击方法，可以更加准确地生成包含敏感数据的样本，并保持样本的多样性和真实性。

Jan, 2022

DNN 隐私泄露：模型倒置攻击和防御方法的调查

模型反演攻击致力于利用对预训练模型的访问权限揭示关于训练数据的私密信息，这些攻击使得对与私密训练数据密切一致的高保真数据的重建成为可能，从而引发了重大的隐私担忧。尽管该领域取得了快速的进展，但我们仍然缺乏对现有模型反演攻击和防御方法的全面概述。为了填补这一空白，本文对该领域进行了深入研究，并提出了综合调查报告。首先，本文简要回顾了机器学习场景下传统的模型反演方法。然后，对多种模态和学习任务下深度神经网络 (DNNs) 的近期攻击和防御方法进行了详细分析和比较。

Feb, 2024