该论文提出了一种基于流的 MIO 表达式,以用于学习最优二叉分类决策树,并可容纳相应的边际约束,从而使决策树设计变得透明和公平。作者通过实验证明,其相较同类现有 MIO 方法,在性能和计算速度方面有明显提升。
Mar, 2021
通过提出一种决策树优化框架,解决了当前领域中两个开放性问题:不平衡数据处理和连续变量完全优化。此外,我们还介绍了一种可扩展的算法,可以在存在连续变量的情况下产生可证明的最优结果,并相对于现有技术将决策树构建速度提高了数个数量级。
Jun, 2020
本研究提出了一种基于动态规划和搜索的学习算法来实现最优决策树,这种算法支持对树的深度和节点数量设置限制,并在实验证明使用我们的算法只需要很短的时间就可以处理具有成千上万个实例的数据集,从而极大地提高了最优决策树的实用性。
Jul, 2020
本研究提出了一个通用框架并构建了一种新型的最优逻辑树模型,该模型采用线性分段逼近法处理逻辑损失,并与 L1 正则项耦合,证明其能够诱导出具有更好可解释性和竞争性推广能力的树状模型,相对于现有的 MIP-based 方法。
Jun, 2023
本文介绍一种新的决策树分类算法,该算法采用连续优化,每个决策节点采取随机决策,实现了较好的性能效果。
Oct, 2021
本文提出了一种混合整数规划的方法来构建特定大小的最优决策树,采用特殊结构的分类特征,考虑每个节点上基于特征子集的组合决策,并通过阈值处理处理数值特征,证明了在中等规模的训练集下,采用小型决策树可获得很高的准确率,我们使用现代求解器解决所提出的优化问题。
Dec, 2016
本论文提出了一种基于分布鲁棒优化的模型,通过设计并分析梯度下降 - 近端镜像上升算法,用一次训练获得一个对多种标签偏移都具有稳健性的单一分类器,并在 CIFAR-100 和 ImageNet 上的实验中展示出其显著的性能提高。
Oct, 2020
本文通过理论分析和大量模拟实验表明:在大样本情况下,许多流行的决策树算法对于对称标签噪声具有鲁棒性,并提供了一些样本复杂度结果来说明其鲁棒性的可靠性。
May, 2016
本研究提出了一种分布鲁棒的随机优化框架,利用凸形式化来解决学习模型受到数据生成分布扰动的问题,并通过多项收敛性保准来证明模型的可靠性,同时也得出了极限定理及有关泛化到未知人群、精细化认知等真实任务的证据。
Oct, 2018
全球优化分类树方法通过建立新的混合整数规划方法,在多个线性和非线性指标的综合下,提供了优于传统方法的解析度和普适性。在延展性和实用性测试中,该方法在小型和中型数据集上相较于随机森林取得了显著的精度提升。
Jan, 2024