朝着更实用的人工智能安全威胁模型

Nov, 2023

朝着更实用的人工智能安全威胁模型

Towards more Practical Threat Models in Artificial Intelligence Security

Kathrin Grosse, Lukas Bieringer, Tarek Richard Besold, Alexandre Alahi

TL;DR最近的研究发现了人工智能安全领域研究与实践之间存在的差距：学术界研究的威胁并不总是反映了人工智能的实际使用和安全风险。我们的研究是为了描述这种差异的完整程度，并将六种最常研究的人工智能安全攻击威胁模型与实际使用中的人工智能进行匹配。我们发现所有的现有威胁模型确实是适用的，但也存在重大差异：研究常常太宽容于攻击者，并假设实际环境中很少可用的信息。因此，我们的论文呼吁在人工智能安全领域研究更多实用的威胁模型。

Abstract

Recent works have identified a gap between research and practice in artificial intelligence security: threats studied in academia do not always reflect the practical use and →

artificial intelligence security threat models practical use security risks mismatches

发现论文，激发创造

针对网络入侵检测系统的逼真对抗攻击建模

通过对网络入侵检测系统进行基于机器学习的威胁模拟，发现现有文献中的威胁模型不适用于实际的网络安全情景，因此，有必要加强现有防御系统以及探索更加真实和有效的对抗方式。

Jun, 2021

机器学习中安全与隐私科学的探索

ML 在安全性方面存在漏洞，提出威胁模型并对攻击进行分类，探究了模型准确性与抗敌对操作的关系。

Nov, 2016

基于机器学习系统的威胁评估

本研究通过分析 89 个真实的机器学习攻击情景，研究机器学习中的威胁特性、识别通用基本应对策略，最终总结出其中的最有针对性的漏洞、攻击手段及其防御方式，以共同为机器学习安全保驾护航。

Jun, 2022

我们可以依赖人工智能吗？

过去十年中，对抗攻击算法揭示了深度学习工具的不稳定性，这些算法引发了与人工智能中的安全性、可靠性和可解释性相关的问题，尤其是在高风险环境中。从实际角度来看，攻击和防御策略开发者之间发生了一场升级战。在更理论层面上，研究人员还研究了关于攻击的存在和可计算性的更大问题。在这篇文章中，我们对该主题进行了简要概述，重点关注对应用和计算数学领域的研究人员可能感兴趣的方面。

Aug, 2023

人工智能的恶意使用：预测、预防和缓解

该报告调查了恶意使用 AI 的潜在安全威胁的现状，并提出了更好地预测，预防和减轻这些威胁的方法。在分析了 AI 可能如何影响数字，物理和政治领域的威胁格局之后，我们为 AI 研究人员和其他利益相关者提出了四个高层次的建议。我们还建议一些有前途的研究领域，以扩展防御手段的组合，或使攻击变得不那么有效或难以执行。最后，我们讨论了进攻者和防御者的长期平衡，但并未得出确定性结论。

Feb, 2018

基于对抗攻击风险选择模型

本研究提出了一种基于统计学建模的评估方法，可以量化敌对攻击导致的危害风险，并演示了该方法的应用结果胜过传统的度量方法。

Jan, 2023

对抗机器学习 -- 行业视角

通过对 28 个组织的采访，我们发现行业从业者缺乏保护、检测和响应机器学习系统攻击的战术和战略工具。此文章旨在从开发者 / ML 工程师和安全事件响应者的角度，阐述了机器学习系统在传统软件安全开发背景下的安全性视图差异，以期鼓励研究人员在对抗 ML 领域中修订和修改软件安全开发生命周期。

Feb, 2020

AAAI 2022 年人工智能网络安全 (AICS) 研讨会会议录

本文讨论了人工智能在网络安全领域的应用，探讨了 AI 面临的挑战，以及在实践中普及 AI 的原因和现实难点。

Feb, 2022

AI 代理的安全性

通过研究典型 AI 代理的工作流程和体验，我们从系统安全的角度详细描述了 AI 代理中存在的潜在漏洞，强调了其原因和严重影响，并介绍了相应的防御机制及其有效性评估实验，从而让 AI 代理的安全性和可靠性得到进一步提升。

Jun, 2024

人工智能中的毒化攻击与防御：一项调研

本文综述了机器学习分类器训练中的数据污染攻击的安全漏洞，并介绍了几种可行的检测和缓解机制，比较了不同方法的性能以及固有属性，如可靠性、隐私和可解释性。同时，提供了未来研究方向的参考。

Feb, 2022