基于特征归因和先验知识的文本分类方法
本研究提出基于期望梯度的新型特征归因方法,并以此为基础推导了新的可调控归因先验。实验结果表明,该方法在图像、基因表达和医疗数据集中均具有较好的性能,可以有效优化模型的解释性能。
Jun, 2019
本文提出了一种基于放松的功能依赖概念的特征选择 / 归因的正式化方法,通过在合成数据集上计算基本真实的归因,评估了许多最先进的归因方法,并展示了即使在优化时,某些归因方法也无法验证所提出的属性并提供错误的解决方案。
Apr, 2021
本文提出一种新的框架,将路径积分、反事实解释和生成模型相结合,以获得包含少量可观察到的人工构件或噪声的归因,并通过对各种复杂度的数据集的流行基准测试进行定量评估,证明这一方法优于现有的替代方法。
Jul, 2021
研究表明,模型的 baseline 对于特征归因的重要性具有重大影响,因此建议针对表格数据提出合理的 baseline 方法,并介绍了新的基线方法分类方法。
Jan, 2021
该论文旨在通过将不同方法或其变种的多个解释结合起来,系统地提高特征归因的质量,从而改进理解和验证复杂的机器学习模型的预测,该组合策略在多个模型架构和流行的特征归因技术中始终优于个别方法和现有基准。
Jun, 2024
本研究中,我们发现使用不同特征先验训练的模型具有较少重叠的失败模式,可以更有效地进行组合,并展示共同训练这些模型对额外 (未标记的) 数据可以互相修正错误,从而提高泛化和对噪声的鲁棒性。
Oct, 2021
通过论证的方式,提出了一种上下文感知特征归因的框架 CA-FATA,该框架将每个特征作为一个支持、攻击或中立预测的论证,通过论证过程进行特征归因计算,具有明确的语义和可解释性,并且能够整合用户上下文等额外信息以实现更准确的预测。
Oct, 2023
本研究探讨了利用特征归因方法进行机器学习的解释,提出通过修改数据集来产生真实归因的方法,并对三种常见的归因方法:显著性图、原理和注意力进行评估,发现这些方法在野外数据集中的正确性和可靠性值得怀疑,建议在部署前使用基准来测试新的归因方法。
Apr, 2021
研究了毒性语言分类器的公正性,考虑了与身份术语之外的重要概念的交互作用,表明身份术语将其它输入特征的作用超越,所得知识可指导去偏见技术以确保训练集中重要概念的充分代表。
Oct, 2022