- 神经欺骗对策如何检测部分伪造的音频?
局部篡改句子可以大大改变其意义。最近的研究表明,训练在部分伪造音频上的对策可以有效地检测此类篡改。然而,目前对对策决策过程的理解有限。我们利用 Grad-CAM 并引入一种定量分析度量来解释对策的决策。我们发现对策优先考虑当连接真实和伪造音 - 机器学习即服务中的推断攻击:分类、综述和研究方向
分析了机器学习中的推断攻击及相应的对策,提出了 3MP 分类系统以规范命名,探讨了各类推断攻击的优缺点、工作流程以及与其他攻击的相互作用,并从一个更全面且新颖的角度指出了几个有前景的研究方向。
- 语言语模与记忆:版权合规的质量和特定性
采用欧洲法律为例,本研究提出了一种系统分析方法, quantifying potential copyright infringements in large language models (LLMs)。通过使用 160 个字符的阈值和模 - ACLSpeechGuard: 多模态大型语言模型的对抗鲁棒性探索
通过设计算法进行白盒和黑盒攻击以实现越狱,提出了对抗越狱攻击的对策,并展示了该对策显著降低攻击成功率。
- 操纵推荐系统:投毒攻击与防御措施综述
该研究报告通过文献综述,提供了关于推荐系统中毒攻击和对策的新分类法,并对文献中描述的 30 多种攻击进行了整理。此外,对于检测和 / 或预防毒攻击的 40 多种对策进行了评估,评估了它们对特定类型攻击的有效性。该综述为保护推荐系统抵御毒攻击 - BadPart:面向像素级回归任务的统一黑盒对抗贴纸攻击
我们提出了第一个针对像素级回归任务的黑盒对抗性补丁攻击框架,旨在发现这些模型在查询式黑盒攻击下的漏洞,我们的攻击原型 BadPart 在垂直视角深度估计任务中击败了三种基线方法,灵活高效地生成补丁,且超越了现有的防御措施。
- 隐私保护模型解释的调查:隐私风险、攻击和对策
解释性人工智能在隐私保护方面的攻击和对策进行了细致的调查和分析,发现了一些隐私泄漏的原因,并提出了未解决的问题和前景研究方向。
- 揭示针对说话人识别的对抗样本 -- 攻击检测和受害模型分类的技术
提出了一种检测对抗性示例的方法,基于新的架构进行攻击类型分类并介绍一种对受害模型进行识别的方法,获得了较高的检测准确率和分类准确率。
- DeSparsify: 视觉 Transformer 中针对标记稀疏化机制的对抗性攻击
我们提出了 DeSparsify,一种针对使用 token sparsification 机制的 vision transformers 的攻击,目的是耗尽操作系统的资源,同时保持其隐蔽性。我们对三种 token sparsificatio - 联邦学习中的隐私威胁与对策调查
本文描述了水平联邦学习、垂直联邦学习和传输联邦学习等典型类型的联邦学习的隐私威胁和对策。
- 基于数据驱动的离线签名验证的深度生成性攻击与对抗措施
通过使用深度生成模型进行生成性攻击,本文探讨了其对数据驱动的签名验证 (DASV) 过程的影响,并提出了切实可行且可解释的对策。通过使用 Variational Auto-encoder (VAE) 和 Conditional Genera - 应用大型语言模型于电力系统:潜在安全威胁
应用大型语言模型(LLMs)于电力系统可以提升决策和运营效率,但也可能带来潜在安全威胁。本文分析了应用 LLMs 于电力系统可能造成的威胁,并强调了对紧急研究和开发应对措施的需求。
- 视觉中可信大规模模型:调查
大型模型的快速进展在深度学习的各个领域中带来了显著的成绩,但其强大性能而不可信赖的行为成为学术界和工业界面临的挑战。本综述总结了在视觉领域中妨碍大型模型信赖使用的四个相关问题,包括人类误用、易受攻击、内在问题和解释性,通过突出每个主题中的相 - 知识图谱推理的安全风险
这篇研究论文讨论了知识图谱推理的安全威胁和 ROAR 攻击,通过实证评估,探讨了潜在的应对措施和未来的研究方向。
- 分析浏览器中的加密货币挖掘
本文通过静态、动态和经济方面的分析,利用机器学习技术和建立分析模型来研究在浏览器内进行加密货币挖掘攻击的程序,并在此基础上构建有效的解决方案。
- 深度学习后门对抗措施鲁棒性的关键评估
本研究对当前三种有效的深度学习后门漏洞防御策略进行了反欺骗攻击测试,重点考察了不同的任务、模型架构、数据集和防御超参数这些因素,揭示了这些策略存在的两种薄弱环节,从而表明开发深度学习后门攻击防范措施的程序的必要性和局限性。
- ACL自然语言理解模型中的金丝雀提取
本论文首次提出用于删除 NLU 训练数据中 Canaries 的攻击,以提高模型逆向攻击的成功率,并针对该攻击提出了多重防御机制。
- ASVspoof 2021: 伪造和深度伪造语音检测进展加速
ASVspoof 2021 提出了新的 deepfake 语音检测任务,介绍了三个任务、每个任务的新数据库、评估指标、四个基线模型、评估平台以及比赛结果,并展示了近年来该领域取得的显著进展,尽管物理访问任务的结果显示在现实、不断变化的物理空 - ICCVOpenForensics 大规模人脸伪造检测与野外分割数据集
本文针对社交媒体中伪造脸部的困扰,进行了综合研究,首次创建了一个大规模数据集 OpenForensics,并利用其丰富注释,评估了各种情景下的最新实例检测和分割方法的效果,以推动深度伪造的预防和人脸检测等方面的研究。
- 针对车载 FMCW 雷达的欺骗攻击
本文提出了一种攻击自动驾驶雷达的系统,使用单一的恶意雷达伪造车辆测量并同时伪造相干的物理测量结果,同时还讨论了一些抵御该攻击的对策。