Mar, 2024

在流式和大规模并行模型中找到决策树分裂

TL;DR本研究提供了数据流算法,以计算决策树学习中的最佳分割点,从而将数据分为两组,使得均方误差(对于回归)或误分类率(对于分类)最小化。这些算法利用亚线性空间和少量遍数解决这些问题,并可扩展到大规模并行计算模型。