人工智能安全：量化视角下的现状

MMFeb, 2020

人工智能安全：量化视角下的现状

AI safety: state of the field through quantitative lens

Mislav Juric, Agneza Sandic, Mario Brcic

TL;DR该研究提供了一个基于文献计量学的量化研究方法，发现自 2015 年以来，AI 安全领域的研究活动显著增加。然而，在技术问题、长期效用、价值联结以及政策方面仍存在一些研究知识空白需要进一步研究和探索。

Abstract

Last decade has seen major improvements in the performance of artificial intelligence which has driven wide-spread applications. Unforeseen effects of such mass-adoption has put the notion of ai safety into the public eye. AI safety is a relatively new field of →

artificial intelligence ai safety bibliometric analysis value alignment research

发现论文，激发创造

AI 安全：必要，但不足且可能存在问题

人工智能安全性的炒作对于推进社会公益的其他人工智能研究途径产生冲突，因为 AI 安全性与透明度等社会公益相关概念存在微妙而棘手的关系。此外，AI 安全性辩论也可能使一些监管工作朝着不太理想的方向发展，同时给会造成结构性伤害的 AI 提供一种贴上安全标签的机会。

Mar, 2024

AI 安全之法律研究

人工智能系统如何安全并与人类价值相一致是一个开放性的研究问题，本文提出有效的法律制度是解决人工智能安全性的最佳途径。

Jul, 2023

系统安全和人工智能

本章提出了七个防止人工智能系统造成伤害的课程，探讨了系统安全领域的见解，针对公共机构及基础设施中的新应用程序引发的新危害，阐述了诊断和消除新人工智能系统危害的共识缺失，并探讨了有效人工智能管理所需的跨学科方法和共享语言。

Feb, 2022

人工智能安全性的具体问题再探讨

AI 安全的概念在社会中日益普及，AI 社区越来越关注 AI Safety 的概念，即防止在 AI 部署过程中系统行为意外偏离设计意图而导致的故障。通过分析真实案例，我们展示了当前的词汇虽然能够涵盖 AI 部署中遇到的一系列问题，但仍需要一个扩展的社会技术框架来更好地理解 AI 系统和实施的安全机制在现实生活中的成功与失败。

Dec, 2023

人工智能安全中的具体问题

讨论机器学习与人工智能技术对社会潜在影响的一个问题：机器学习系统中的意外事故风险和如何抵御。我们提出了五个与事故风险相关的实际研究问题，涉及到错误的目标函数、过于昂贵的监督、安全探索和分布变化等方面。最后，思考了如何更具生产力地思考人工智能前瞻性应用的安全问题。

Jun, 2016

工业应用中人工智能的安全性和安全性方面

本文讨论机器学习中的安全和安保问题，主要涉及神经网络分类、视觉应用和预测性维护等领域，指出了其中存在的安全和安保漏洞，为推广该技术提供了风险评估的方法。

Jul, 2022

人工智能伦理调查：社会技术观点

这项研究综合了当前和未来的人工智能应用所面临的伦理问题，从技术和社会角度对 AI 部署中的公平性、隐私和数据保护、透明度与可解释性等伦理原则进行了综述。

Nov, 2023

AI 研究中的人类存在安全考虑（ARCHES）

通过介绍 AI 的 prepotence 特性，分析 AI 在未来可能存在的 existential risks，并通过技术研究指导原则，提出潜在的研究方向，以促进 existential safety 的保障。

May, 2020

伦理道德作为人工智能治理工具的效率

本文对人工智能伦理学的现状进行了批判性分析，并认为基于原则性伦理准则的这种治理形式不足以规范人工智能行业及其开发者。建议通过对人工智能相关专业人员的培训过程和增加对其行业的监管来实现根本性变革。为此，建议法律应从生物伦理学中获益，并将人工智能伦理学的探索成果在法律条文中加以明确规范。

Oct, 2022

值得信赖的人工智能：计算视角

本文从计算的角度综述了 AI 可信赖性的最新技术，其中包含了六个方面：安全、非歧视与公平、可解释性、隐私、责任与审计能力以及环境福祉，旨在帮助读者理解可信赖 AI 的最新技术以及现实系统的应用。

Jul, 2021