Jul, 2023

人工道德代理的最低可解释性要求

TL;DR本文概述了人工智能可解释性的一个快速发展子领域 - 基于道德决策的可解释性模型,并介绍了最小可解释性水平 (Minimum Level of Interpretability, MLI) 的概念,以及为不同类型的代理建议 MLI 的安全部署方式。