使用机器学习确定任何一组划分程序的最佳加权,并通过实验证明,学习如何分叉在实践中非常有益,可以显著减小树的规模。
Mar, 2018
本文探讨了 k-Balanced Partitioning 问题的两类近似算法:快速但准确度不高和保证高质量准确度但速度较慢的算法。研究表明,这种运行时间和解决方案质量之间的权衡是必要的。我们还提出了一种基于图形类别的规约框架,以证明了该问题的困难性。本文是该问题的第一次双层次不可近似结果。
Nov, 2011
本研究提出了一种针对各种划分问题的机器学习算法,通过样本学习来获得适合特定应用场景的算法配置,同时也为算法配置的基础和学习理论的发展做出了贡献。
Nov, 2016
使用稀疏感应的 soft decision trees 取代传统的决策树集成方法,可以克服它们的光滑性差和受维度灾难的困扰。在 Bayesian additive regression trees 框架下实现该方法,理论上得到强大的支持,并在基准数据集上表现出良好的性能。
Jul, 2017
提出了 Convex Adaptive Partitioning (CAP) 这一新的非参数方法,它可以在响应函数上受到凸性或凹性限制的情况下进行多元回归。CAP 是计算有效的,适用于定价具有大量基础资产的美式篮式期权的价值函数近似,并表明 CAP 的计算复杂度为 O (nlog (n) log (log (n)))。
May, 2011
提出了两种新算法以及相应的下限,适用于树集合,展示了决策树和树集合分类训练数据集所需的切割数相比,随着树的数量增加,集合所需的切割数可能会指数级下降。
Jun, 2023
本文提出了一种贝叶斯推导和计算的新方法,通过递归划分样本空间来定义,并通过有效的数据结构组织划分来近似整个密度函数以及规范化常数,可用于证据估计或快速后验采样,并具有与最新技术相当的性能。
Oct, 2020
本篇论文利用决策树表示数据观测过程并使用基于贝叶斯决策理论的先验概率分布,将实现统计上最优的预测结果。同时,我们解决了计算 Bayes 最优预测的问题,例如内部节点的特征分配问题,实现方法为应用马尔可夫链 - 蒙特卡洛方法,其步长可以根据先验分布自适应调整。
该论文介绍了一种基于顺序蒙特卡罗算法来近似贝叶斯决策树的后验分布的方法,与现有的基于局部 MCMC 的方法相比,该算法具有更好的计算效率和精度。
Mar, 2013
提出一种非参数方法,使用不连续方法将一段给定范围上未知的连续概率密度函数近似成为分段常数函数,并使用偏差度量描述分继过程以控制二叉分区。该算法简单高效,且有可证明的收敛速率,其在密度估计等广泛任务上的应用效果得到了实证验证。
Apr, 2014