Nov, 2023

机器学习管道中的信息泄漏

TL;DR机器学习(ML)提供了强大的预测建模工具,然而,如果不正确实施和评估,ML 流程可能会出现泄漏问题,导致过于乐观的性能估计并且无法泛化到新数据,本文旨在拓展对于在设计、实施和评估 ML 流程中导致泄漏的原因的理解,以具体示例说明,提供了各种类型的泄漏的综合概述和讨论。