基於後門的可解釋 AI 評估方法的高保真度評估基準

May, 2024

基於後門的可解釋 AI 評估方法的高保真度評估基準

Backdoor-based Explainable AI Benchmark for High Fidelity Evaluation of Attribution Methods

Peiyu Yang, Naveed Akhtar, Jiantong Jiang, Ajmal Mian

TL;DR我们提出了一个遵循可信度准则的基于后门攻击的可解释人工智能基准（BackX），并且通过使用我们的基准对现有方法进行了综合比较和评估，同时为防御后门攻击提供了指导。

Abstract

attribution methods compute importance scores for input features to explain the output predictions of deep models. However, accurate assessment of attribution methods is challenged by the lack of benchmark fideli

attribution methods benchmarks evaluation explainable ai backdoor attacks

发现论文，激发创造

解析 AI 归因方法的精确基准测试

我们提出了一种新的评估方法，用于基准测试最先进的可解释 AI 归因方法，该方法由合成的分类模型及其衍生的地面实况解释组成，该方法提供了关于 XAI 方法输出的更深入的洞察。

Aug, 2023

评估 XAI 事后技术的准确性：与地面真实解释数据集的比较研究

评估可解释人工智能方法与其基础模型的逼真度是一项具有挑战性的任务，本研究通过引入三个可靠的解释基准数据集，对当前最先进的可解释人工智能方法进行公平客观的比较，以识别逼真度较低的方法，并将其排除在进一步研究之外，促进了更可靠和有效的可解释人工智能技术的发展。研究结果表明，基于输出信息反向传播到输入的可解释人工智能方法相比于基于敏感性分析或类激活模式的方法具有更高的准确性和可靠性，但反向传播方法往往会生成更多噪声显著图。这些发现对于可解释人工智能方法的进展具有重要意义，可以消除错误的解释，促进更健壮可靠的可解释人工智能的发展。

Nov, 2023

关于 XAI 的保真度度量的综合研究

使用透明模型决策树作为基准，研究提出了一种新的测度指标验证 XAI 方法的准确性，结果显示了现有的测度指标在真实场景中不可靠，并建议开发新的指标以解决这些问题。

Jan, 2024

忠诚度度量中的不一致问题

解释性人工智能（XAI）领域旨在解释黑盒机器学习模型的工作方式，而选择合适的方法以及衡量本地解释的忠实度的当前指标缺乏一致性，使得使用者在选择最忠实的解释时感到困惑。

Nov, 2023

我们需要另一种可解释的 AI 方法吗？将事后可解释性评估方法统一为一种交互式和多维基准

提出了一种名为 Compare-xAI 的基准测试框架，该框架统一了 xAI 算法的所有排他性功能测试方法，帮助研究人员、从业人员和普通人解释模型结果，同时提供了可互动的用户界面。

Jun, 2022

OpenXAI：朝向机器学习模型解释的透明化评估

介绍了 OpenXAI—— 一种全面的且可扩展的开源框架，用于评估和基准测试事后解释方法。 OpenXAI 包括一个灵活的合成数据生成器和各种真实世界数据集，预先训练的模型和最先进的特征归因方法的集合，以及评估解释方法准确性、稳定性和公平性的 22 种定量度量的开源实现，并且该框架还包含公开的 XAI 排行榜，用于基准测试解释方法。

Jun, 2022

使用相对特征重要性对归因方法进行基准测试

该研究提出了一个基准测试框架，用于定量评估不同的特征归因方法的效果，并指出某些方法更容易产生错误的特征解释，该框架包括精心设计的数据集、已知相对特征重要性的模型和三个互补的度量标准。

Jul, 2019

EXACT：用于机器学习模型解释方法经验基准测试的平台

该研究论文介绍了一个旨在改善复杂机器学习模型可解释性的解释性人工智能（XAI）领域的发展趋势，并提出了一个初始的基准测试平台 EXACT，该平台结合了各种基准数据集和新颖的性能评估指标，为评估 XAI 方法提供了一个标准化的基础。

May, 2024

可解释机器学习科学研究的合成基准

通过发布一套合成数据集及相应的特征归因（feature attribution）算法基准测试库 XAI-Bench，可以有效评估和比较不同的特征归因方法，解决了在检验真实数据集上评估模型可解释性的难题。

Jun, 2021

您能相信您的解释吗？特征归因方法的健壮性测试

评估对非敌对扰动的稳健性并分析神经网络和表格数据集上应用的可解释 AI 方法的稳健性，展示如何利用流形假设和集成方法对稳健性进行深入分析。

Jun, 2024