Jun, 2015

自适应数据分析与留存重用中的泛化

TL;DR本文针对过拟合问题,提出了一种适用于自适应数据分析的算法,使用保留集重复验证后得到的假设,避免了过度拟合问题,同时利用描述长度和差分隐私,展示了在适应性场景下保证统计有效性的方法,并通过近似最大信息的方法将这些方法统一起来。