利用情境反事实推理进行信念校准

ICMLJul, 2023

利用情境反事实推理进行信念校准

Leveraging Contextual Counterfactuals Toward Belief Calibration

Qiuyi, Zhang, Michael S. Lee, Sherol Chen

TL;DR通过用多目标优化来校准背景驱动的反事实推理，我们提出了 “信仰校准周期” 框架，以更全面地校准信仰多样性。

Abstract

Beliefs and values are increasingly being incorporated into our ai systems through alignment processes, such as carefully curating data collection principles or regularizing the loss function used for training. However, the →

ai systems meta-alignment problem beliefs calibration counterfactual reasoning multi-objective optimization

发现论文，激发创造

使用多目标优化探索反事实解释中的可信度、变化强度和对抗能力之间的权衡

使用多目标优化模型，通过生成逆因模型生成可信的对抗实例，以提高深度学习模型的透明度，检测偏见和数据不当的形式。

May, 2022

使用反事实推论的因果视角评估和缓解图像分类器中的偏差

该研究提出了一种利用结构原因模型和 ALI 生成对抗学习算法，生成能满足图像属性之间因果关系约束的反事实例，用于解释和评估神经网络模型的偏差，并使用反事实正则化方法消除分类器训练数据中对皮肤和头发颜色等多维属性的偏见。

Sep, 2020

通过数学优化在基于得分的分类中生成集体反事实解释

利用数学优化模型，通过集体反事实解释为给定组内各实例提供一个反事实解释，以使扰动实例的总成本在一定约束下最小化，从而检测对整个数据集都至关重要的特征，验证了该方法的实用性。

Oct, 2023

反事实解释可被操纵

本文介绍了反事实解释的脆弱性并表明其容易被操纵，进一步提出了一个新颖的目标来训练明显公平的模型，在轻微扰动下反事实解释可以找到更低成本的救济措施。然而，我们在贷款和暴力犯罪预测数据集上的实验表明，这些模型可能会不公平地提供低成本的救济措施给特定的子群体。这些发现引起了对当前反事实解释技术可信度的担忧，并希望能启发对健壮性反事实解释的探索。

Jun, 2021

因果背景连接反事实公平与稳健预测和群体公平

我们利用因果上下文桥接了反事实公平、鲁棒预测和群体公平之间的差距，展示了它们之间的等价关系，并通过测量相对简单的群体公平指标来测试反事实公平。

Oct, 2023

纵向反事实：限制与机遇

利用纵向数据评估和改进反事实推理中的可信度，通过比较纵向差异与反事实差异，生成可信的反事实，探讨利用反事实推理的困难。

Feb, 2024

探索面向以人为中心的人工智能的对抗性调整损失

基于反事实生成的人类中心框架实现对深度神经网络的解释引导学习，并显示对人体的准确对齐，从而在肺癌诊断数据集上展示出的有效性。

Oct, 2023

探究自动生成的反事实数据在情感分析中的有效性

提出了一种自动产生对立数据的方法，基于此数据增广训练集可以有效提高 NLP 模型的性能。

Jun, 2021

多目标反事实解释

该研究提出了一种多目标反事实解释方法（MOC），将反事实搜索转化为多目标优化问题，通过对特征空间的多样性维护，返回一组不同权衡的反事实，并在实际案例中展示了 MOC 的有用性和与现有方法的对比。

Apr, 2020

深度模型的一致对法推断

本篇论文研究了深度网络下，机器学习模型一致性与反事实样本的关系，在权重初始化和数据保留等初步训练条件发生微小变化时，提出了通过稳定邻近搜索算法来生成更一致解释的反事实样本的方法，并证明了该方法在多个基准数据集上具有有效性。

Oct, 2021