- 基于多变量布尔规则的最优分类树 (BooleanOCT)
全球优化分类树方法通过建立新的混合整数规划方法,在多个线性和非线性指标的综合下,提供了优于传统方法的解析度和普适性。在延展性和实用性测试中,该方法在小型和中型数据集上相较于随机森林取得了显著的精度提升。
- 一个用于在大数据集上训练深度分类树的 GPU 加速移动视野算法
引入了一种用于具有连续特征的分类树的移动视距差分进化算法 (MH-DEOCT),通过在每个节点上迭代训练浅子树来平衡视觉和优化器能力,实验证明其在训练和测试准确性上优于启发式方法 CART 的平均 3.44% 和 1.71%,同时在深树和大 - 学习对分布变化鲁棒的最优分类树
基于混合整数规划技术,我们提出了一种学习鲁棒分类树的方法,通过问题转化和约束生成的解决方法,在公共可用数据集上展示了最差情况准确率提高了 12.48%,平均情况准确率提高了 4.85%。
- ODTlearn:用于预测和处方的学习最佳决策树的软件包
ODTLearn 是一个开源 Python 软件包,提供了基于 MIO 框架的方法,用于高风险预测和建议任务中学习最优决策树。
- 一种优化分类树学习的新型记忆策略
本文提出一种新颖的演化算法,结合可行解空间的探索和局部搜索,用于归纳分类树,以达到具有一般化能力的结构,其表现与最先进的方法相当,并适用于包含成千上万数据点的数据集。
- 滚动前瞻学习最优分类树
提出一种基于滚动子树向前算法的分类树构建算法,能够有效解决最优算法存在的学习病理问题,并在大量计算分析实验中证明其相较于最优算法与局部最优算法能够提升 23.6% 和 14.4% 的模型准确率
- AAAI斜决策树的反事实解释:精确、高效算法
本文以分类树为基础模型,探讨了对于分类模型,如何通过微调特征使其对某个目标分类,进而提供可行的建议来推翻决策,并提供了解决方案,对金融、医疗或法律等领域具有重要意义。
- 训练数据代价高时的学习:类分布对树归纳的影响
针对实际应用中的大规模归纳学习问题,针对有限的训练数据,本文基于 26 个数据集的研究结果,分析了不同的类别分布对于分类树所识别模型性能的影响,在此基础上提出了一种基于预算的递进采样算法为分类树的分类性能提供较优的训练数据集。
- 提高分类树的精度
提出了四种改善模型精度的技术,在真实和模拟数据集上与树集成等其他算法进行对比,以提高分类树中选择关键预测变量和识别有趣的子组的能力。
- CARTwheels 算法:挖掘 Redescriptions 的交替算法
这篇论文介绍了一个基于分类树的算法,以及将其应用于一种新的数据挖掘任务 —— 重描述挖掘。该算法和任务在生物信息学等领域非常重要,可以帮助集成多种数据形式,将已获得的知识应用到其他数据集,并用于发现数据中隐蔽的、微妙的特征。论文分析了算法设