可解释模型的概率式数据集重建

Aug, 2023

Probabilistic Dataset Reconstruction from Interpretable Models

Julien Ferry, Ulrich Aïvodji, Sébastien Gambs, Marie-José Huguet, Mohamed Siala

TL;DR解释性是可信任机器学习的一个关键要求，因为通过学习和发布一些内在可解释的模型可以泄露有关底层训练数据的信息，而这可能直接与隐私冲突。本文提出了一个新的框架，用于处理其他形式的可解释模型和更普遍的知识，并证明在对可解释模型结构做出现实的假设的情况下，可以有效地计算重建的不确定性。最后，我们通过比较精确学习算法和启发式学习算法关联的理论信息泄漏，说明了我们方法的适用性，使用决策树和规则列表。我们的结果表明，对于给定的准确性水平，最优解释性模型通常更紧凑，泄露的关于训练数据的信息更少。

Abstract

interpretability is often pointed out as a key requirement for trustworthy machine learning. However, learning and releasing models that are inherently interpretable leaks information regarding the underlying tra

interpretability machine learning privacy probabilistic reconstruction decision trees

发现论文，激发创造

可解释性作为统计推论

通过统计推断方法构建了一种概率模型，通过学习模型参数和使用神经网络选择器来实现解释性预测，并利用新数据集进行了实验验证，证明了使用多重插补提供了更合理的解释。

Dec, 2022

可解释性的代价

本文提出一个基于数学框架的方法，构建以逐步可解释的模型。我们演示了应用于实际和合成数据集的实用算法，并定量化了 “可解释性” 的 “价格” 与预测准确性的权衡。

Jul, 2019

操纵与测量模型可解释性

在高风险领域中，机器学习模型已经被广泛用于辅助决策，而开发可解释的模型的兴趣逐渐增加。然而，是否这些模型能实现预期的效果，我们缺乏实验研究来证明。本研究开展了一系列预先注册的实验，展示了具有不同要素的模型，以调查它们的可解释性。结果表明，模型越透明、特征越少，参与者越能成功地模拟模型的预测，但是参与者并没有更加倾向于紧密关注其预测，而拥有透明的模型却使参与者因信息过载难以检测和修正模型的重大错误。这些结果强调了开发可解释模型时实验测试的重要性。

Feb, 2018

使用机器学习设计可解释决策支持系统是什么？

本文提出增强学习可用于学习不同用户可解释的模型，由此建立他们对机器学习模型的信任。通过与医生交互，基于神经网络模型，设计了一个基于强化学习的临床决策支持系统，结果表明，机器学习专家无法准确预测哪个系统输出将最大化临床医生对底层神经网络模型的信心，这些结果对将来机器学习可解释性研究以及机器学习在医学中的应用都具有广泛的意义。

Nov, 2018

模型提取实现可解释性

这篇论文提出一种名为模型抽取的方法，通过构建一个可解释程度更高的模型来近似黑箱模型，从而理解和调试机器学习模型在各种数据集上训练的结果，并在经典强化学习问题中学习控制策略。

Jun, 2017

可解释的模型用于理解沉浸式模拟

本文介绍了比较评估高维时间序列数据模型可解释性的方法，使用了常用的教育和医疗培训模拟中的日志数据，设计了两种解释性测试，评估模型输出与人们对模拟发生的期望或直觉的一致程度，发现完全贝叶斯方法在统计和人类可解释性测试的性能方面表现良好，是完全自动化模型选择的一个良好的选择。

Sep, 2019

通过模型提取方法解释黑匣子模型

为了解释黑盒模型，本文提出使用决策树对其进行全局解释，并采用新的决策树提取算法避免过拟合，评估表明该方法正确率更高且可解释性更强。

May, 2017

可解释的机器学习：定义、方法和应用

该研究呈现了机器学习的可解释性与 PDR 框架，探讨了现有解释方法的分类与优劣评估，提供了实际案例并讨论了未来研究方向。

Jan, 2019

可解释的深度学习：解释、可解释性、可信度及其他

本文综述了神经网络的解释工具和算法，提出了一种新的分类方法，介绍了解释结果的评估方法和信任度算法的应用，讨论了深度模型解释与鲁棒性和借鉴解释的联系，并介绍了一些开源库。

Mar, 2021

可解释的低资源法律裁决

该研究利用深度学习模型解决了商标法中的混淆风险问题，并介绍了一种模型无关的可解释中间层和弱监督学习策略，这对于高风险应用领域非常有效。

Jan, 2022