拥有众多优秀模型带来惊人成果
本文通过机器学习算法的方法探测预测模型的有效性,以预测人类生成的随机序列为例,对问题中可预测变量的阐述进行了实验,发现现有的行为模型只能解释大约15%的可预测变化,并提供了一种有效的方法来评估理论在不同情境下的效果,从而得出机器学习在检测理论完整性上的可行性。
Jun, 2017
本文针对Leo Breiman的文章《The Two Cultures》进行批判性反思,重点讨论了Breiman所谓的“Rashomon Effect”,探究了许多模型可能有相同的预测精度,但处理数据方式却有很大差异,从而导致根据模型拟合数据得出的结论或自动决策变得困难的现象,同时与机器学习文献相连结并指出应该致力于算法和数据建模文化的合作。
Apr, 2021
首次提供了一种完整枚举稀疏决策树中Rashomon set的技术,并通过特定的数据结构提供高效的查询和抽样,该技术可以使用户在精度相近的所有模型中实现无前提选择,并展示了三个应用,包括研究变量的重要性、平衡精度和F1得分的Rashomon set的枚举以及使用完整数据集产生只使用数据子集构建的Rashomon set。
Sep, 2022
本研究分析了在多家模型提供商竞争市场环境下,机器学习模型的规模对预测准确度的影响,并发现在某些情况下,即使提高数据表示质量可以减少贝叶斯风险,但整体而言也会导致跨用户的总体预测准确性下降。
Jun, 2023
本研究分析了Rashomon效应对可解释机器学习的影响,提供了三种不同比较场景的统一视角,并在不同数据集、模型、归因方法和指标上进行了定量评估,结果发现超参数调整和指标选择对结果有实质影响,并为科学家和实践者带来挑战。
Jun, 2023
在本研究中,我们探讨了数据生成过程中的机制以及分析师在学习过程中做出的选择,以确定Rashomon比率的大小。我们证明了更嘈杂的数据集通过从业者训练模型的方式导致较大的Rashomon比率。此外,我们还引入了一种称为模式多样性的度量,该度量捕捉了Rashomon集中不同分类模式之间的平均预测差异,并解释了它为什么会随着标签噪声的增加而增加。我们的结果解释了为什么简单模型在复杂且有噪声的数据集上通常能和黑盒子模型表现一样好的一个关键因素。
Oct, 2023
通过利用dropout技术来探索Rashomon集合中的模型,提出了一个用于衡量和减轻预测多样性的新框架,通过严格的理论推导和实验证明该技术在预测多样性度量估计方面始终优于基准方法,并通过dropout集成和模型选择实现了高效的Rashomon集合探索和度量估计。
Feb, 2024
通过研究Rashomon集合中模型更新引起的冲突预测多样性,本文提出了一种传统多样性度量方法用于预测模型的非稳定预测数量,以及如何通过该方法预测、减少和避免消费者应用中的冲突。
Feb, 2024
通过Rashomon效应研究平衡方法对预测多样性的影响,发现平衡方法会增加预测多样性并产生不同结果。为了在建模过程中负责任地监控性能和预测多样性之间的权衡,我们提出使用扩展性能增益图进行模型选择。
Mar, 2024