道德解释型人工智能的场景与建议

AAAINov, 2019

道德解释型人工智能的场景与建议

Scenarios and Recommendations for Ethical Interpretive AI

John Licato, Zaid Marji, Sophia Abraham

TL;DR人类有理智推断的能力，是人工智能系统需要学习的技能之一。本文通过研究一个涉及伦理规则的数据集，提出人工智能系统应如何实现可以模仿人类成因推断的能力，并给出了相关建议。

Abstract

Artificially intelligent systems, given a set of non-trivial ethical rules to follow, will inevitably be faced with scenarios which call into question the scope of those rules. In such cases, human reasoners typically will engage in →

artificial intelligence ethical rules interpretive reasoning human-centered ai dataset

发现论文，激发创造

人工智能模型语义可解释性

本研究从广阔的角度观察模型可解释性，超越了机器学习的范畴，涵盖了分布语义学和模糊逻辑等不同的人工智能领域。我们根据模型的性质和它们引入可解释性方面的方法进行分类，并分析每种方法如何影响最终用户。同时指出还需要解决的问题，以提供更以人为本的解释性解决方案。

Jul, 2019

人工智能能为我做些什么：评估机器学习解释在合作游戏中的作用

我们提出了一种解释方法，并通过一个真实的任务和真实的人类用户的评估来衡量它的有效性。这项工作旨在为人机协作中的自然语言处理提供设计指导。

Oct, 2018

打造可理解的人工智能的挑战

本文旨在探讨人工智能在关键任务中的应用，提出了增强人工智能可解释性的重要性，并总结了当前构建可解释模型及说明方法的研究进展和关键方向。

Mar, 2018

建设具有道德约束的人工智能

本文提出伦理约束 AI 的概念，探讨在 AI 普及的情况下如何确保 AI 代理具备合适的伦理品质与决策技能，涉及决策制定中的模块化和组合方法。

Dec, 2018

使人工智能可理解：哲学基础

人类和人工智能是否能共享概念并进行交流？《使人工智能变得可理解》展示了意义形而上学的哲学研究如何回答这些问题，Cappelen 和 Dever 利用哲学中的外在主义传统构建了人工智能和人类相互理解的模型，从而改进了哲学传统，给出了有关理论和实践的重要答案，为实现可解释的人工智能迈出了重要的第一步。

Jun, 2024

模型可解释性的人类评估的挑战与机遇

本文提出了 “描述性解释” 和 “说服性解释” 的区别，讨论了功能解释与认知功能和用户偏好可能相关的推理，并提出了两个研究方向来消除认知功能和解释模型之间的歧义，保持准确性和可解释性之间的权衡控制。

Nov, 2017

当人工智能代替我们回答问题时的认知考虑

通过使用逻辑 - 符号推理来解决人工智能可能存在的认识上问题，来避免擅自运用人工智能对输出内容和结果的不当控制，从而遵守 Grice 的质量最大化和 Lemoine 的法律无罪最大化原则。

Apr, 2023

使人工智能更易解释的不同方法学综述

人们对越来越多的决策由机器完成的需求增加，但黑盒模型的决策推理令人不解，因此需要关注决策推理的清晰度与可解释性，以及如何扩展到反事实思考。

Nov, 2023

社会、法律、道德、同理心和文化规则：编制与推理（扩展版）

AI 系统的实施需要遵守 SLEEC 规则，该研究通过语言分析和逻辑编程框架的应用提供了一个可行的策略。

Dec, 2023

面向医疗人工智能的统一功利伦理框架

通过分析次级调查数据，我们确定了人工智能在医疗领域中的伦理原则，并提出了一个基于功利主义伦理的新的理论框架来设计医疗领域的伦理人工智能。

Sep, 2023