ROIC-DM：通过扩散模型的稳健文本推理与分类

AAAIJan, 2024

ROIC-DM：通过扩散模型的稳健文本推理与分类

ROIC-DM: Robust Text Inference and Classification via Diffusion Model

Shilong Yuan, Wei Yuan, Tieke HE

TL;DR该论文介绍了一种基于扩散模型（ROIC-DM）构建的鲁棒文本推理和分类模型，通过利用去噪阶段的训练，ROIC-DM 相对于传统语言模型具有更好的鲁棒性，并且可以将它们作为顾问组件有效地融合，达到相当甚至更好的性能。

Abstract

While language models have made many milestones in text inference and classification tasks, they remain susceptible to adversarial attacks that can lead to unforeseen outcomes. Existing works alleviate this probl

language models adversarial attacks defense strategies diffusion models textual adversarial attacks

发现论文，激发创造

评估文本到图像扩散模型对真实攻击的鲁棒性

本研究对文本到图像扩散模型进行了鲁棒性评估，考虑到实际应用中可能存在的各种语义一致但现实错误的攻击方式，揭示了该模型的鲁棒性问题。

Jun, 2023

单一扩散模型实现鲁棒分类

本文提出了一种鲁棒扩散分类器 (Robust Diffusion Classifier, RDC)，它是一个基于预训练扩散模型构建的生成分类器，可以更好地应对未知威胁并实现识别准确率的提高

May, 2023

DiffuseDef: 对抗攻击下的改进鲁棒性

通过结合迁移学习、扰动模型和集成学习技术，我们提出了一种新颖和灵活的文本分类对抗防御方法 DiffuseDef，它在编码器和分类器之间引入扩散层作为去噪器，经过迭代去噪和集成生成鲁棒的文本表示。实验证明，DiffuseDef 在各种对抗性攻击中表现优异，实现了最先进的性能。

Jun, 2024

ProTIP: 针对随机扰动的文图扩散模型进行概率稳健性验证

通过引入概率性的文本到图像扩散模型（T2I DMs）的鲁棒性概念，并建立一个高效的统计性保证评估框架（ProTIP），本研究在解决生成过程的高计算成本和对比两个输出分布以确定扰动输入是否为对抗性示例的困难之后，通过实证实验验证了 ProTIP 在评估鲁棒性和效率方面相较于通用的 T2I DMs 的有效性，并展示了将 ProTIP 应用于常用防御方法排序的应用场景。

Feb, 2024

LaDiC：扩散模型在图像生成的文本方面真的不如自回归模型吗？

Diffusion models have the potential for enhancing image-to-text generation and surpass Auto-Regressive models by introducing LaDiC, which incorporates context modeling, a dedicated latent space for captions, a regularization module, a diffuser for semantic conversion, and a Back&Refine technique, achieving state-of-the-art performance on the MS COCO dataset without pre-training or ancillary modules.

Apr, 2024

MMA-Diffusion：多模态对抗扩散模型

近年来，文本到图像（T2I）模型取得了显著进展并广泛应用，然而这一进展无意中开辟了潜在的滥用途径，尤其是生成不适宜或不安全的内容。我们的工作引入了 MMA-Diffusion，这是一个对 T2I 模型安全性构成严重和真实威胁的框架，通过有效绕过开源模型和商业在线服务的当前防御措施。与以往的方法不同，MMA-Diffusion 利用文本和视觉模式来绕过提示过滤器和事后安全检查器等保护措施，从而揭示现有防御机制的弱点。

Nov, 2023

基于 Robust CLIP 的检测器用于揭示扩散模型生成的图像

通过使用 CLIP 模型提取的图像和文本特征以及多层感知器（MLP）分类器，本研究引入了一个强大的检测框架，并提出了一种能够改善检测器鲁棒性的新型损失函数，以及在模型训练中平整化损失函数空间从而改善检测器的泛化能力。通过大量实验证明了我们方法的有效性，超越了传统检测技术，在 DM 生成的图像检测领域有望成为新的最先进方法。

Apr, 2024

对抗净化的鲁棒扩散模型

我们提出了一种具有逆向过程的鲁棒性指导方法，该方法独立于预训练的扩散模型，在不重新训练或微调扩散模型的情况下实现了对抗训练策略，保留了更多的语义内容，并减轻了扩散模型的准确性和鲁棒性之间的权衡，从而为基于扩散模型的对抗净化方法提供了对新攻击的高效适应能力。通过大量实验证实，我们的方法达到了最先进的结果，并展现了对不同攻击的泛化能力。

Mar, 2024

使用扩散模型揭示文本 - 图像不一致性

为了解决在线误导信息的问题，该研究引入了 D-TIIL（基于扩散的文本 - 图像不一致性定位），采用文本对图像扩散模型来定位文本和图像对中的语义不一致性，并通过文本嵌入和修改后的图像区域进行可视化。

Apr, 2024

自然图像文本编辑的混合扩散

本文介绍了一种基于自然语言描述和兴趣区域掩码进行本地（面向区域的）在通用自然图像中进行编辑的解决方案，利用 CLIP 预训练语言 - 图像模型指导编辑并使用扩散概率模型生成自然外观结果，以及应用扩散过程的增强进行抗击对抗攻击；通过在多个基线和相关方法上的定量和定性比较，表明该方法在整体逼真度、保护背景和匹配文本方面均优于现有解决方案，并展示了多种文本驱动的编辑应用，如添加新对象，删除 / 替换 / 修改现有对象，背景替换和图像推理。

Nov, 2021