利用差分隐私的强鲁棒性异常检测与后门攻击检测

Nov, 2019

利用差分隐私的强鲁棒性异常检测与后门攻击检测

Robust Anomaly Detection and Backdoor Attack Detection Via Differential Privacy

Min Du, Ruoxi Jia, Dawn Song

TL;DR本篇论文提出了差分隐私可以用于改善异常检测、新奇性检测、以及背门攻击检测的效果，并通过理论分析和广泛实验验证了差分隐私在这些任务中的帮助.

Abstract

outlier detection and novelty detection are two important topics for anomaly detection. Suppose the majority of a dataset are drawn from a certain distribution, →

outlier detection novelty detection backdoor poisoning attacks machine learning differential privacy

发现论文，激发创造

隐私与可解释性之间的权衡：异常检测的差分隐私分析

我们的研究利用可解释的人工智能（XAI）和差分隐私（DP）之间的权衡，通过 SHapley Additive exPlanations (SHAP) 和差分隐私 (DP) 进行异常检测（AD），并对不同的模型和各种数据集进行了全面评估，结果显示，隐私保护对检测准确性和可解释性有显著影响，这取决于数据集和所考虑的异常检测模型，同时我们还发现，AD 算法的选择也会影响解释的可视化。

Apr, 2024

针对差分隐私学习器的数据毒化攻击与防御

本文旨在研究数据污染攻击及其对机器学习的影响，提出差分隐私保护措施以防范攻击，并设计了攻击算法，试图从目标和输出的角度影响学习器，实验结果表明，攻击者在污染足够多的训练数据时，攻击方法的有效性较高。

Mar, 2019

DisDet：探索扩散模型上后门攻击的可检测性

首次从防守者和攻击者的角度对扩散模型进行了系统研究，探索了被破坏的扩散模型中毒噪声输入的可检测性和躲避机制，并提出了基于分布差异的低成本触发器检测方法。

Feb, 2024

基于扩散式图像变体的鲁棒训练对抗数据

隐形功能型后门攻击对训练神经网络构成了严重的安全威胁，本文提出了一种基于扩散模型及知识蒸馏的新方法，能够在潜在受污染的数据集上训练模型，并生成具备对抗后门触发的鲁棒性的学生模型。

Oct, 2023

重新思考后门攻击

通过分析训练数据的结构信息，我们对反向门攻击问题提出了一种不同的方法，指出这些攻击在一般情况下是不可能被检测到的。基于此观察，我们重新审视了现有的反向门攻击防御措施并对其隐含的假设进行了表征。最后，基于假设条件，我们提出了一种新的原始方法来检测反向门攻击，并开发了一个具有理论保证且实用的检测算法。

Jul, 2023

通过异常检测在污染攻击中检测对抗训练样例

本文提出一种防御机制来弥补机器学习中数据毒化的影响，该机制基于离群值检测来检测所谓的最优攻击策略生成的对抗样本与真实样本之间的差异。

Feb, 2018

个人隐私与群体隐私：学习攻击匿名化

通过比较差分隐私和 l - 多样性数据的准确分类器推断私人属性，研究发现即使采用差分隐私，也能够推断出个体的隐私属性。

Nov, 2010

污染数据异常检测的潜在异常暴露

本研究提出一种在未标记异常情况下训练异常检测器的策略，通过联合推断二进制标签（正常 vs. 异常）并更新模型参数来使用两个损失的组合，表现出比基准测试更显著的改进。

Feb, 2022

差分隐私是否在实践中防止了后门攻击？

通过实证研究，我们调查了 DP-SGD 和 PATE 在防止后门攻击方面的有效性，并首次检验了 PATE 在文献中的作用。我们的实验揭示了超参数和训练数据集中后门数量对 DP 算法成功的影响。此外，我们提出了 Label-DP 作为 DP-SGD 和 PATE 的更快、更准确的替代方法。我们得出的结论是，尽管 Label-DP 算法通常提供较弱的隐私保护，但准确的超参数调整可以使其在防御后门攻击并保持模型准确性方面更有效。

Nov, 2023

深度学习中绕过后门检测算法

本文提出了一种对抗性的植入算法，可以绕过现有的包括最先进技术在内的检测算法，呼吁设计对抗感知的防御机制来检测后门攻击。

May, 2019