通过提出一种决策树优化框架,解决了当前领域中两个开放性问题:不平衡数据处理和连续变量完全优化。此外,我们还介绍了一种可扩展的算法,可以在存在连续变量的情况下产生可证明的最优结果,并相对于现有技术将决策树构建速度提高了数个数量级。
Jun, 2020
通过使用智能猜测策略,我们可以在几个数量级的时间里降低运行时间,提供对最佳决策树误差和表达能力偏差的界限,并在许多情况下快速构建与黑盒模型的匹配精度的稀疏决策树。
Dec, 2021
本文提出了一种连续优化方法来构建精简的最佳分类树,基于斜裁剪,并旨在在整个树中使用较少的预测变量进行剪枝。该方法模拟了本地和全局稀疏性,证明了其对提高分类精度具有实用性。
Feb, 2020
本研究提出了三种算法来高效地稀疏加权决策树优化,解决了算法无法处理加权数据样本的问题,这在影响个体数据点上的倒数概率加权方面有重要应用.
Oct, 2022
本文提出了一种动态编程方法来构建确切的最优稀疏回归树,并基于一维 k-Means 聚类算法提出了新的下界,我们能够在几秒钟内找到具有挑战性的数据集的最优稀疏树。
Nov, 2022
该论文提出了一种基于流的 MIO 表达式,以用于学习最优二叉分类决策树,并可容纳相应的边际约束,从而使决策树设计变得透明和公平。作者通过实验证明,其相较同类现有 MIO 方法,在性能和计算速度方面有明显提升。
Mar, 2021
本研究提出了一种基于动态规划和搜索的学习算法来实现最优决策树,这种算法支持对树的深度和节点数量设置限制,并在实验证明使用我们的算法只需要很短的时间就可以处理具有成千上万个实例的数据集,从而极大地提高了最优决策树的实用性。
Jul, 2020
本文提出了一种混合整数规划的方法来构建特定大小的最优决策树,采用特殊结构的分类特征,考虑每个节点上基于特征子集的组合决策,并通过阈值处理处理数值特征,证明了在中等规模的训练集下,采用小型决策树可获得很高的准确率,我们使用现代求解器解决所提出的优化问题。
Dec, 2016
解释性对于医生、医院、制药公司和生物技术公司来分析和做出决策具有重要意义,而树状方法作为生存分析中广泛采用的方法之一,具有解释性强和捕捉复杂关系能力的优点,但是现有的大多数方法依赖启发式算法来生成生存树模型,存在产生次优模型的风险,本文提出了一种动态规划和界限方法,可以在几秒内找到证明最优稀疏生存树模型。
Jan, 2024
该论文提出了一种算法,该算法能够基于全局目标同时优化决策树的所有级别的分裂函数和叶参数,使用随机梯度下降进行优化,实验结果表明,该算法相比贪心算法在分类任务的表现优秀。
Nov, 2015