Sep, 2023

T-COL: 生成变量机器学习系统一般用户偏好的反事实解释

TL;DR机器学习领域中存在无法解释的问题,通过引入可行的建议并解释为什么产生特定结果的对抗性解释(CEs)被提出。我们提出了几种被用户研究验证的常规用户喜好,并将其映射到 CEs 的特性,同时引入了一种名为 T-COL 的新方法,该方法在生成适应常规用户喜好的 CEs 的同时,能够在替换 ML 模型时生成更加稳健和有效的 CEs。经过实验证明,与基准方法包括大型语言模型相比,T-COL 更适用于适应用户喜好和变量 ML 模型。