跨多种深度学习范式的强大后门数据检测

Feb, 2023

跨多种深度学习范式的强大后门数据检测

ASSET: Robust Backdoor Data Detection Across a Multiplicity of Deep Learning Paradigms

Minzhou Pan, Yi Zeng, Lingjuan Lyu, Xue Lin, Ruoxi Jia

TL;DR研究表明，大多数现有的后门检测方法在不同的攻击和毒害比率上的性能存在显著差异，并且在最先进的干净标签攻击下都失败了。提出了一种新的检测方法 ASSET，它在端到端 SL 设置中优于现有方法，并提供了第一款针对 SSL 和 TL 的实用后门防御。

Abstract

Backdoor data detection is traditionally studied in an end-to-end supervised learning (SL) setting. However, recent years have seen the proliferating adoption of self-supervised learning (SSL) and transfer learning

backdoor detection self-supervised learning transfer learning active separation via offset state-of-the-art clean-label attack

发现论文，激发创造

SSL-OTA：自我监督学习中目标检测的后门威胁揭示

我们提出了一种用于自我监督学习场景下对象检测任务的首个后门攻击方法，名为对象变换攻击（SSL-OTA）。该攻击方法包括两种攻击：数据毒化攻击（NA）和双源混合攻击（DSBA），并且在基准数据集上进行了广泛实验证明了攻击的有效性和实用性，这突出了在基于自我监督学习的对象检测中考虑后门威胁的重要性，并为该领域提供了一种新的视角。

Dec, 2023

对 SSL 后门攻击的一种极简防御方法

自我监督学习（SSL）已经成为应对无人监督数据环境的一种强大范例。然而，最近的研究表明 SSL 容易受到后门攻击的威胁，控制模型以适应攻击者目的。本文引入一种基于频率的新型后门攻击：CTRL，并提出了两种对抗 SSL 中基于频率攻击的防御策略：一种适用于模型训练前，另一种适用于模型推断期间。使用自监督学习的对象分类作为下游任务，我们展示了成功的防御策略，无需重新训练模型。

Mar, 2024

自监督学习的后门攻击

该研究探讨了对于基于无监督大规模未标注数据的自监督学习方法的后门攻击，提出了通过知识蒸馏的防御方法，并在实验中取得了成功。

May, 2021

通过集群激活屏蔽消除自监督学习的后门

提出了一种通过集群激活屏蔽和新颖的 PoisonCAM 方法来消除自我监督学习背门攻击的痕迹，并在 ImageNet-100 数据集上达到 96% 的背门触发器检测准确率。

Dec, 2023

如何只利用未标记数据制作后门？

通过对未标记的数据进行自我监督学习（SSL），本研究调查了基于后门攻击的潜在风险，在没有标签信息的情况下，通过聚类和对比度选择两种毒化策略，证明了在许多 SSL 方法中，无标签后门攻击可以有效地超越随机毒化。

Apr, 2024

自监督学习中基于补丁的后门攻击的防御

本文研究针对自监督学习中的数据投毒后门攻击，提出了一种三步防御管道，其中包括使用训练模型搜索被毒害的样本并将其从训练集中移除的防御算法 PatchSearch。研究结果表明，PatchSearch 是一种有效的防御，其表现优于基线和最先进的防御方法（包括使用额外的干净、可靠数据的方法），可以将模型在包含触发器的图像上的准确性从 38.2% 提高到 63.7%，接近于干净模型的准确性 64.6%。

Apr, 2023

自我监督学习中不可察觉的后门攻击

自我监督学习模型容易受到后门攻击，而现有的有效后门攻击方法常常涉及可察觉的触发机制，如有颜色的补丁，容易被人类检查出来。本文提出了一种对自我监督模型有效而又难以察觉的后门攻击方法，通过优化特定触发机制的设计，使其与自我监督学习中的增广转换有区分度，并对人类视觉难以察觉。在五个数据集和七个自我监督学习算法上的实验证明了我们的攻击方式极其有效且隐秘，并且对现有后门防御具有很强的抵抗力。我们的代码可以在此链接中找到。

May, 2024

利用自监督深度学习增强乳腺癌筛查乳腺 X 线摄影的检测能力

本研究探讨了基于强数据扩充的无监督自我学习技术在人工智能应用中的重要作用，以乳腺癌检测为例，通过实验验证表明使用该技术可以大幅提高数据利用率，而且更容易迁移到其他数据集，是医学图像人工智能领域迈向无监督学习和去掉传统稀缺标签的重要突破。

Mar, 2022

自监督学习提升合成孔径声纳目标识别

这项研究探讨了自监督学习（SSL）在合成孔径声纳（SAS）图像识别改进中的应用，结果表明，尽管两个 SSL 模型在少样本情况下可以优于完全监督模型，但在使用全部标签时不能超过其性能，这有助于减少数据标记的时间和成本，同时提供了远程感知中使用 SSL 的证据。

Jul, 2023

自监督解决无监督异常检测的困境和机遇

自我监督学习在无监督异常检测中起到重要作用，对 SSL 策略的选择、超参数的调整、预处理任务和增强函数的设计以及基于密度估计的预训练模型的利用提出了新的发展和挑战。

Aug, 2023