拥有众多优秀模型带来惊人成果

Jul, 2024

Amazing Things Come From Having Many Good Models

Cynthia Rudin, Chudi Zhong, Lesia Semenova, Margo Seltzer, Ronald Parr...

TL;DRRashomon Effect对机器学习在复杂问题中的应用具有巨大影响，包括预测模型、标签数据、算法选择等方面。

Abstract

The rashomon effect, coined by Leo Breiman, describes the phenomenon that there exist many equally good predictive models for the same dataset. This phenomenon happens for many real datasets and when it does, it

发现论文，激发创造

这个理论是有预测性的，但它是否完整？一个关于人类对随机性感知的应用

本文通过机器学习算法的方法探测预测模型的有效性，以预测人类生成的随机序列为例，对问题中可预测变量的阐述进行了实验，发现现有的行为模型只能解释大约15％的可预测变化，并提供了一种有效的方法来评估理论在不同情境下的效果，从而得出机器学习在检测理论完整性上的可行性。

Jun, 2017

重温罗生门：对“两种文化”的评论

本文针对Leo Breiman的文章《The Two Cultures》进行批判性反思，重点讨论了Breiman所谓的“Rashomon Effect”，探究了许多模型可能有相同的预测精度，但处理数据方式却有很大差异，从而导致根据模型拟合数据得出的结论或自动决策变得困难的现象，同时与机器学习文献相连结并指出应该致力于算法和数据建模文化的合作。

Apr, 2021

探究稀疏决策树的整个拉绍门集

首次提供了一种完整枚举稀疏决策树中Rashomon set的技术，并通过特定的数据结构提供高效的查询和抽样，该技术可以使用户在精度相近的所有模型中实现无前提选择，并展示了三个应用，包括研究变量的重要性、平衡精度和F1得分的Rashomon set的枚举以及使用完整数据集产生只使用数据子集构建的Rashomon set。

Sep, 2022

在竞争环境下，改进的贝叶斯风险可能导致社会福利的减少

本研究分析了在多家模型提供商竞争市场环境下，机器学习模型的规模对预测准确度的影响，并发现在某些情况下，即使提高数据表示质量可以减少贝叶斯风险，但整体而言也会导致跨用户的总体预测准确性下降。

Jun, 2023

解释性机器学习中罗生门效应的实证评估

本研究分析了Rashomon效应对可解释机器学习的影响，提供了三种不同比较场景的统一视角，并在不同数据集、模型、归因方法和指标上进行了定量评估，结果发现超参数调整和指标选择对结果有实质影响，并为科学家和实践者带来挑战。

Jun, 2023

简化模型之路始于噪声

在本研究中，我们探讨了数据生成过程中的机制以及分析师在学习过程中做出的选择，以确定Rashomon比率的大小。我们证明了更嘈杂的数据集通过从业者训练模型的方式导致较大的Rashomon比率。此外，我们还引入了一种称为模式多样性的度量，该度量捕捉了Rashomon集中不同分类模式之间的平均预测差异，并解释了它为什么会随着标签噪声的增加而增加。我们的结果解释了为什么简单模型在复杂且有噪声的数据集上通常能和黑盒子模型表现一样好的一个关键因素。

Oct, 2023

基于Dropout的Rashomon集探索技术用于高效的预测乘性估计

通过利用dropout技术来探索Rashomon集合中的模型，提出了一个用于衡量和减轻预测多样性的新框架，通过严格的理论推导和实验证明该技术在预测多样性度量估计方面始终优于基准方法，并通过dropout集成和模型选择实现了高效的Rashomon集合探索和度量估计。

Feb, 2024

利用一组优秀模型进行预测性用户流失

通过研究Rashomon集合中模型更新引起的冲突预测多样性，本文提出了一种传统多样性度量方法用于预测模型的非稳定预测数量，以及如何通过该方法预测、减少和避免消费者应用中的冲突。

Feb, 2024

不平衡分类中平衡方法的拉细幕效应实验研究

通过Rashomon效应研究平衡方法对预测多样性的影响，发现平衡方法会增加预测多样性并产生不同结果。为了在建模过程中负责任地监控性能和预测多样性之间的权衡，我们提出使用扩展性能增益图进行模型选择。

Mar, 2024

高效勘探规则集模型的拉肖蒙集合

本研究提出了一种高效的方法，可在有限的搜索中探索具有或不具有穷尽搜索的规则集模型的Rashomon集合。广泛的实验证明了所提方法在各种情况下的有效性。

Jun, 2024