Dec, 2023

二叉决策树和随机森林中的条件偏差及其消除

TL;DR本文通过调查决策树和随机森林分类与回归中的条件操作符选择的偏差,针对具有格特征的特征的存在,提出了消除这种偏差的技术,并证明了偏差可能导致 AUC 和 r² 得分的显著差异。此外,通过提出的技术与最坏情况相比,在 AUC 和 r² 得分方面实现了统计显著的改进。