ICMLJul, 2023
利用情境反事实推理进行信念校准
Leveraging Contextual Counterfactuals Toward Belief Calibration
Qiuyi, Zhang, Michael S. Lee, Sherol Chen
TL;DR通过用多目标优化来校准背景驱动的反事实推理,我们提出了 “信仰校准周期” 框架,以更全面地校准信仰多样性。
Abstract
Beliefs and values are increasingly being incorporated into our ai systems
through alignment processes, such as carefully curating data collection
principles or regularizing the loss function used for training. However, the
→
ai systemsmeta-alignment problembeliefs calibrationcounterfactual reasoningmulti-objective optimization
发现论文,激发创造
使用反事实推论的因果视角评估和缓解图像分类器中的偏差
该研究提出了一种利用结构原因模型和 ALI 生成对抗学习算法,生成能满足图像属性之间因果关系约束的反事实例,用于解释和评估神经网络模型的偏差,并使用反事实正则化方法消除分类器训练数据中对皮肤和头发颜色等多维属性的偏见。
Sep, 2020
通过数学优化在基于得分的分类中生成集体反事实解释
利用数学优化模型,通过集体反事实解释为给定组内各实例提供一个反事实解释,以使扰动实例的总成本在一定约束下最小化,从而检测对整个数据集都至关重要的特征,验证了该方法的实用性。
Oct, 2023
反事实解释可被操纵
本文介绍了反事实解释的脆弱性并表明其容易被操纵,进一步提出了一个新颖的目标来训练明显公平的模型,在轻微扰动下反事实解释可以找到更低成本的救济措施。然而,我们在贷款和暴力犯罪预测数据集上的实验表明,这些模型可能会不公平地提供低成本的救济措施给特定的子群体。这些发现引起了对当前反事实解释技术可信度的担忧,并希望能启发对健壮性反事实解释的探索。
Jun, 2021
因果背景连接反事实公平与稳健预测和群体公平
我们利用因果上下文桥接了反事实公平、鲁棒预测和群体公平之间的差距,展示了它们之间的等价关系,并通过测量相对简单的群体公平指标来测试反事实公平。
Oct, 2023
多目标反事实解释
该研究提出了一种多目标反事实解释方法(MOC),将反事实搜索转化为多目标优化问题,通过对特征空间的多样性维护,返回一组不同权衡的反事实,并在实际案例中展示了 MOC 的有用性和与现有方法的对比。
Apr, 2020
深度模型的一致对法推断
本篇论文研究了深度网络下,机器学习模型一致性与反事实样本的关系,在权重初始化和数据保留等初步训练条件发生微小变化时,提出了通过稳定邻近搜索算法来生成更一致解释的反事实样本的方法,并证明了该方法在多个基准数据集上具有有效性。
Oct, 2021