安全的人工智能 -- 如何实现？

Jan, 2022

Safe AI -- How is this Possible?

Harald Rueß, Simon Burton

TL;DR本文探讨了 AI 系统在不可预测的环境下操作时带来的挑战，提出了一种严格的工程框架，旨在最大程度地减小不确定性，从而提高对 AI 系统安全行为的信心。

Abstract

Ttraditional safety engineering is coming to a turning point moving from deterministic, non-evolving systems operating in well-defined contexts to increasingly autonomous and learning-enabled →

safety engineering ai systems learning-enabled uncertainty rigorous framework

发现论文，激发创造

系统安全和人工智能

本章提出了七个防止人工智能系统造成伤害的课程，探讨了系统安全领域的见解，针对公共机构及基础设施中的新应用程序引发的新危害，阐述了诊断和消除新人工智能系统危害的共识缺失，并探讨了有效人工智能管理所需的跨学科方法和共享语言。

Feb, 2022

迈向保证安全的人工智能：确保强大可靠 AI 系统的框架

通过世界模型、安全规范和验证器的相互作用，提出了一系列保证安全的人工智能（AI）方法，旨在为 AI 系统提供高保证的量化安全保证，并描述了核心技术挑战和潜在解决方案。

May, 2024

人工智能安全性的具体问题再探讨

AI 安全的概念在社会中日益普及，AI 社区越来越关注 AI Safety 的概念，即防止在 AI 部署过程中系统行为意外偏离设计意图而导致的故障。通过分析真实案例，我们展示了当前的词汇虽然能够涵盖 AI 部署中遇到的一系列问题，但仍需要一个扩展的社会技术框架来更好地理解 AI 系统和实施的安全机制在现实生活中的成功与失败。

Dec, 2023

人工智能安全：一代新的生成式人工智能和控制系统安全的后裔

泛人工智能与人类的互动达到了前所未有的规模，为巨大的积极影响提供了新途径，但也引发了广泛关注，担忧其对个体和社会可能造成的伤害。本文中，我们认为，对这些人工智能技术的有意义的安全保证只能通过思考人工智能输出与人类行为之间形成的反馈循环如何推动交互走向不同结果来实现。为此，我们设想了从控制论到人类中心的人工智能安全的快速增长能力之间的高价值契机，为未来几十年的人类中心人工智能安全奠定了新基础。

May, 2024

没有法规就没有信任！

机器学习在工业系统中的应用以及其安全性和合规性对于决策辅助等关键功能具有重要意义，然而，当前机器学习组件的低形式化程度和不确定性使得使用传统的关键系统工程方法难以验证和验证其安全性，因此需要制定适用于人工智能的规范和监管标准，提出可信的人工智能认证方法和工具。

Sep, 2023

安全案例：为先进人工智能系统提供安全证明

AI 系统的安全性是一个重要的考量，因此作者提出了一个结构化的理由框架，包含四个类别的论证，以证明 AI 系统在训练和部署过程中不太可能引发灾难，并提到控制措施的强度、即使可能造成伤害也是可信的、以及可信的 AI 顾问的权威等内容。

Mar, 2024

AI 安全之法律研究

人工智能系统如何安全并与人类价值相一致是一个开放性的研究问题，本文提出有效的法律制度是解决人工智能安全性的最佳途径。

Jul, 2023

人工智能的系统挑战：伯克利视角

该论文探讨了人工智能的发展带来的挑战，提出了在系统、架构和安全方面的研究方向，以解决 AI 技术存储和处理数据量的限制，并提高数据隐私保护，以便这一技术能够更好地改善人们的生活和社会。

Dec, 2017

构建可靠的深度学习系统

介绍了人工智能技术的广泛应用和存在的问题，并提出了对 “AI 工程” 学科的需求，探讨了相关概念和需要解决的关键挑战。

Oct, 2019

不要信任，总是验证：可信 AI 的路线图？

本文对基于人工智能技术的系统的可验证性与数据存在的偏差问题进行了讨论，并提出了可信 AI 所需满足的一些属性和模型。

Jun, 2022