决策树学习的全球评估

Aug, 2022

Global Evaluation for Decision Tree Learning

Fabian Spaeh, Sven Kosub

TL;DR将聚类中的距离传递到决策树的构建过程中，通过全局距离代替单个叶节点评估，提出了一种改进的 ID3 算法，并与原版本进行比较，讨论其在实践中的优势和问题，进而确定其他适用于全局评估的场景。

Abstract

We transfer distances on clusterings to the building process of decision trees, and as a consequence extend the classical id3 algorithm to perform modifications based on the global distance of the tree to the gro

decision trees id3 algorithm global distance ground truth evaluations

发现论文，激发创造

提高决策树模型的稳定性

通过研究实际医疗应用中的决策树模型，引入了一种新的距离度量方法并提出了一种新的训练方法，以增强模型的稳定性，探究决策树稳定性、预测能力和可解释性之间的平衡。在六个实际医疗应用案例的定量和定性分析中表明，通过小幅度的预测能力下降（4.6%），可以显著提高模型的稳定性（38%）。

May, 2023

多个决策树

本文研究使用多棵决策树对预测结果进行平均，比使用单棵决策树更能提高预测准确性。作者利用修改版的 ID3 算法选出优秀的决策树进行平均，证明了结构不同的决策树集合进行平均比单棵决策树更优，提高了预测性能。

Mar, 2013

具有泛化保证的监督度量学习

本篇论文提出一种新的核函数以及一种新的编辑相似性模型，可以更好地优化距离和相似度函数，提高 k 近邻算法的性能，并在学习相似性时考虑到泛化能力与算法的稳定性，解决了当前度量学习方法的局限性，为特征向量和结构化对象（如字符串或树）的度量学习提供了新方法。

Jul, 2013

自适应符号嵌入的树编辑距离学习：补充材料和结果

该论文提出了一种基于嵌入的新型度量学习方法，通过嵌入树节点向量来学习编辑距离，使欧几里得距离支持类别判别并提高分类准确率，该方法在包括计算机科学、生物医学和自然语言处理数据集的六个基准数据集上优于目前树形度量学习技术的最新技术。

May, 2018

决策树学习中选择的力量

我们提出了一种简单的决策树学习算法的泛化方法，称为 Top-k，它考虑了 k 个最佳属性作为可能的分割点，相较于贪婪算法和最优决策树算法，在准确率和可扩展性方面都取得了显著的优势。

Oct, 2023

一种基于分布的软聚类比较和评估方法

本论文提出了一种创新性的解决方案，通过以软聚类 (Soft Clustering) 作为硬聚类 (Hard Clustering) 分布的形式来扩展比较度量，以适应 SC 算法结果中的不确定性。经过深入研究和实验证明此方法的可行性。

Jun, 2022

树状图距离：一种使用层次聚类评估生成网络的度量标准

我们提出了一种用于生成建模评估的新颖度量方法，主要关注生成网络。该方法使用树状图来表示真实数据和虚假数据，从而能够计算训练样本和生成样本之间的差异。该指标专注于模式坍塌，针对无法捕捉训练集中所有模式的生成器。为了评估所提出的方法，在真实数据集上进行了基于采样的验证方案引入，因此该指标在一个受控环境中进行评估，并且证明在与其他最先进的方法相比中具有竞争力。

Nov, 2023

使用梯度下降学习决策树

本研究提出了一种使用梯度下降学习固定坐标轴的坚硬 Decision Trees 的新方法，该方法使用反向传播来联合优化所有树参数，相比于现有方法，我们的方法在二元分类基准上表现更好，并在多类任务中取得了竞争性的结果。

May, 2023

Tree Mover's Distance: 桥接图度量和图神经网络的稳定性

本文提出了一种针对属性图的伪度量（TMD），并研究了它与泛化的关系，显示出 TMD 捕捉了与图分类相关的属性，且良好相关性对于泛化的 GNNs 来说性能下降。

Oct, 2022

使用关系决策树扩展启发式规划

本文提出了一种基于机器学习的启发式计划搜索控制方法，通过学习搜索启发式计划的控制策略，实现了减少计算节点评估的目的，并通过两种方法（使用分类器作为行动策略和将分类器应用于生成前瞻状态）有效提高搜索效率，解决了现有启发式计划算法在可伸缩性方面的不足。

Jan, 2014