KDDApr, 2021

真实负样本重要性:使用真实负样本进行延迟反馈模型的连续训练

TL;DR本文提出了一种 DEFER 方法以解决模型训练中留样问题和转化动作的确定性不足问题。该方法在训练管道中注入真实负样本以确保观察特征分布等于实际分布,并使用重要采样加权损失函数以纠正分布偏移。DEFER 已在阿里巴巴的展示广告系统中实际应用, 在多种场景下推动了转化率 6.0% 以上的改进。