回归树的稳定更新

Feb, 2024

Stable Update of Regression Trees

Morten Blørstad, Berent Å. S. Lunde, Nello Blaser

TL;DR通过使用经验稳定性的概念，我们提出了一种正则化方法，该方法根据初始模型中的不确定性对数据点进行加权，并提供了在可预测性和经验稳定性之间取得平衡的算法，通过调整超参数来调节这种平衡。结果表明，所提出的更新方法在改善稳定性的同时实现了类似或更好的预测性能。这表明在更新回归树时可以实现预测性和稳定的结果。

Abstract

updating machine learning models with new information usually improves their predictive performance, yet, in many applications, it is also desirable to avoid changing the model predictions too much. This property is called →

updating machine learning models stability explainability regression trees regularization method

发现论文，激发创造

提高决策树模型的稳定性

通过研究实际医疗应用中的决策树模型，引入了一种新的距离度量方法并提出了一种新的训练方法，以增强模型的稳定性，探究决策树稳定性、预测能力和可解释性之间的平衡。在六个实际医疗应用案例的定量和定性分析中表明，通过小幅度的预测能力下降（4.6%），可以显著提高模型的稳定性（38%）。

May, 2023

技术笔记：偏置与稳定性的量化

研究机器学习算法偏差对预测精度的影响时，应考虑稳定性因素，本文提出了一种基于概念一致性的稳定性度量方法，讨论了稳定性、预测精度和偏差之间的关系。

Dec, 2002

树状可解释人工智能：从局部解释到全局理解

通过运用博弈论、局部特征交互作用效应和全局模型结构，我们实现了对基于树的机器学习模型的高可解释性，应用于三个医疗机器学习问题，在透露模型全局结构的同时保持其基本特征，识别出美国人口中高强度但低频率的非线性死亡风险因素，突显具有共同危险特征的明显人口亚组，识别出慢性肾脏疾病危险因素之间的非线性交互作用效应，并监测在医院部署的机器学习模型（Identifying factors leading to model's performance decay over time）

May, 2019

通过进化树网络学习回归的简明表示

研究一种学习针对回归问题的可解释表示的方法，将特征表示为由神经网络中常用的激活函数和其他基本函数组成的多类型表达树的网络。通过梯度下降来训练可微分特征，并利用特征在线性模型中的性能来加权每个表示子组件的变化率。该方法可以产生比梯度提升更小、在 100 个开源回归问题上的平均测试得分更高的表示。

Jul, 2018

连续数据更新下的模型稳定性

本研究探讨了机器学习模型的稳定性问题，提出了评估模型稳定性的方法，并发现网络架构和输入表示等模型设计选择对稳定性有重大影响，推荐在进行建模选择时考虑准确性和抖动之间的权衡。

Jan, 2022

正则化黑盒模型以提高可解释性（HILL 2019 版本）

本文提出了一种新的方法，即在训练时直接对黑盒模型进行可解释性正则化，以改善解释效果，提高模型的可解释性，并保持一定的准确性。

May, 2019

针对提升隐私保护的机器学习稳定性技术的新型综述

研究了提高模型稳定性的各种技术，从而最小化机器学习中隐私化的负面影响。

May, 2024

机器学习集成中的预测不稳定性

在机器学习集成中，多个模型的预测被汇总。本文证明了一个定理，表明任何集成模型都会展现出至少一种形式的预测不稳定性，从而需要在信息利用的好处和预测不稳定性的风险之间取得平衡。该分析还揭示了特定集成算法所产生的预测不稳定性的形式，例如像随机森林或 xgboost 这样的流行树集成算法将违反基本的、直观的单调性和公平性属性。

Jul, 2024

回归树懂微积分

用于预测分析的回归树通过估计梯度提高了模型的能力，并解决了不确定性量化的任务，同时提供了模型行为的解释。

May, 2024

区域树正则化用于黑盒模型的可解释性

本文介绍了一种名为 “地区树规则化” 的方法，它可以在维持准确率的同时让神经网络更具有可解释性，该方法通过预先定义输入空间中特定区域所需的决策逻辑，鼓励深层模型分别被数个分离的决策树所逼近，本方法在多个数据集上都比只训练每个区域的决策树更能提高准确预测，同时比其他神经网络规则化方案更简单，并不会破坏预测能力；两个医疗案例证明了本方法可以通过对神经网络的审查来提高理解。

Aug, 2019