学习对分布变化鲁棒的最优分类树

Oct, 2023

学习对分布变化鲁棒的最优分类树

Learning Optimal Classification Trees Robust to Distribution Shifts

Nathan Justin, Sina Aghaei, Andrés Gómez, Phebe Vayanos

TL;DR基于混合整数规划技术，我们提出了一种学习鲁棒分类树的方法，通过问题转化和约束生成的解决方法，在公共可用数据集上展示了最差情况准确率提高了 12.48%，平均情况准确率提高了 4.85%。

Abstract

We consider the problem of learning classification trees that are robust to distribution shifts between training and testing/deployment data. This problem arises frequently in high stakes settings such as public

classification trees distribution shifts robust optimization mixed-integer programming accuracy improvement

发现论文，激发创造

强优化分类树

该论文提出了一种基于流的 MIO 表达式，以用于学习最优二叉分类决策树，并可容纳相应的边际约束，从而使决策树设计变得透明和公平。作者通过实验证明，其相较同类现有 MIO 方法，在性能和计算速度方面有明显提升。

Mar, 2021

通用和可扩展的最优稀疏决策树

通过提出一种决策树优化框架，解决了当前领域中两个开放性问题：不平衡数据处理和连续变量完全优化。此外，我们还介绍了一种可扩展的算法，可以在存在连续变量的情况下产生可证明的最优结果，并相对于现有技术将决策树构建速度提高了数个数量级。

Jun, 2020

MurTree：使用动态规划和搜索实现的最优分类树

本研究提出了一种基于动态规划和搜索的学习算法来实现最优决策树，这种算法支持对树的深度和节点数量设置限制，并在实验证明使用我们的算法只需要很短的时间就可以处理具有成千上万个实例的数据集，从而极大地提高了最优决策树的实用性。

Jul, 2020

损失最优分类树：一个广义框架和逻辑回归情形

本研究提出了一个通用框架并构建了一种新型的最优逻辑树模型，该模型采用线性分段逼近法处理逻辑损失，并与 L1 正则项耦合，证明其能够诱导出具有更好可解释性和竞争性推广能力的树状模型，相对于现有的 MIP-based 方法。

Jun, 2023

最优随机分类树

本文介绍一种新的决策树分类算法，该算法采用连续优化，每个决策节点采取随机决策，实现了较好的性能效果。

Oct, 2021

基于整数规划的最优广义决策树

本文提出了一种混合整数规划的方法来构建特定大小的最优决策树，采用特殊结构的分类特征，考虑每个节点上基于特征子集的组合决策，并通过阈值处理处理数值特征，证明了在中等规模的训练集下，采用小型决策树可获得很高的准确率，我们使用现代求解器解决所提出的优化问题。

Dec, 2016

通过分布式鲁棒性优化应对标签漂移

本论文提出了一种基于分布鲁棒优化的模型，通过设计并分析梯度下降 - 近端镜像上升算法，用一次训练获得一个对多种标签偏移都具有稳健性的单一分类器，并在 CIFAR-100 和 ImageNet 上的实验中展示出其显著的性能提高。

Oct, 2020

关于标签噪声下决策树学习的鲁棒性

本文通过理论分析和大量模拟实验表明：在大样本情况下，许多流行的决策树算法对于对称标签噪声具有鲁棒性，并提供了一些样本复杂度结果来说明其鲁棒性的可靠性。

May, 2016

通过分布式稳健优化实现统一性能学习模型

本研究提出了一种分布鲁棒的随机优化框架，利用凸形式化来解决学习模型受到数据生成分布扰动的问题，并通过多项收敛性保准来证明模型的可靠性，同时也得出了极限定理及有关泛化到未知人群、精细化认知等真实任务的证据。

Oct, 2018

基于多变量布尔规则的最优分类树 (BooleanOCT)

全球优化分类树方法通过建立新的混合整数规划方法，在多个线性和非线性指标的综合下，提供了优于传统方法的解析度和普适性。在延展性和实用性测试中，该方法在小型和中型数据集上相较于随机森林取得了显著的精度提升。

Jan, 2024