Feb, 2024

随机森林和过拟合的理解:可视化和仿真研究

TL;DR随机森林被用于临床风险预测模型,本研究以卵巢恶性肿瘤预测为案例,通过三个真实案例和一个模拟研究,通过二维分布热图和训练数据的概率峰值将风险估计进行可视化,模拟研究结果表明随机森林模型学习到训练集中的概率峰值,训练集上的 c-statistics 接近 1 且测试集上效果显著。