Jun, 2020

增强蒸馏技术的表格数据快速准确简单模型

TL;DRFAST-DAD是一种能够将复杂的模型集合精简为促进部署的个体模型的方法,它基于数据增强策略,并使用基于自注意力的伪似然估计器的吉布斯采样。在30个跨越回归和二元/多类分类任务的数据集上,FAST-DAD精炼方法得到的个体模型比在原始数据上进行标准培训获得的模型更快而且更准确,可以超过AutoML工具如H2O / AutoSklearn生成的集成预测器10倍以上。