真实负样本重要性：使用真实负样本进行延迟反馈模型的连续训练

KDDApr, 2021

真实负样本重要性：使用真实负样本进行延迟反馈模型的连续训练

Real Negatives Matter: Continuous Training with Real Negatives for Delayed Feedback Modeling

Siyu Gu, Xiang-Rong Sheng, Ying Fan, Guorui Zhou, Xiaoqiang Zhu

TL;DR本文提出了一种 DEFER 方法以解决模型训练中留样问题和转化动作的确定性不足问题。该方法在训练管道中注入真实负样本以确保观察特征分布等于实际分布，并使用重要采样加权损失函数以纠正分布偏移。DEFER 已在阿里巴巴的展示广告系统中实际应用，在多种场景下推动了转化率 6.0% 以上的改进。

Abstract

One of the difficulties of conversion rate (CVR) prediction is that the conversions can delay and take place long after the clicks. The delayed feedback poses a challenge: fresh data are beneficial to continuous training but may not have complete label information at the time they are ingested into the training pipeline. To balance model freshness and label

conversion rate prediction delayed feedback defer importance sampling display advertising

发现论文，激发创造

鲜度还是准确度，何不兼得？通过动态图神经网络解决延迟反馈

在本研究中，我们提出了一种名为 DGDFEM 的延迟反馈建模方法，它使用动态图神经网络来解决预测转化率中的延迟反馈问题，并在模型训练中提出了一种名为 HLGCN 的新型图卷积方法，实现了数据新鲜度和标签准确性的平衡。我们在三个行业数据集上进行了大量实验证明了我们方法的一致优越性。

Aug, 2023

通过标签修正实现延迟反馈建模的渐进无偏估计

提出一种 DEFUSE 方法用于解决在线广告中的延迟反馈问题，并通过双分布建模框架共同建模数据中的无偏直接正例和有偏延迟转化，从而达到更好的转化率预测效果。

Feb, 2022

利用经过时间采样来捕捉转化率预测中的延迟反馈

本文提出了一种基于时间采样的延迟反馈模型（ES-DFM），利用重要性采样方法优化真实转化分布的期望，并基于此为 CVR 预测的 loss function 赋权，以解决数字广告中的转化率预测问题。

Dec, 2020

全空间转化率延迟反馈建模预测

本文提出了一个新颖的神经网络框架 ESDF，它从整个空间的角度模型化 CVR 预测，并结合了用户顺序行为模式和时间延迟因素，以同时解决数据稀疏性、样本选择偏差和延迟反馈等三大挑战。经过大量实验，ESDF 已经成为 CVR 预测领域统一解决这三大挑战的首次尝试。

Nov, 2020

一种非参数化延迟反馈模型用于转化率预测

本研究提出了一种非参数化滞后反馈模型，用于预测展示广告中的转化率，可以反映各种时间延迟的分布形状，并在实验中证明其优于指数分布模型。

Feb, 2018

基于时间窗口假设的延迟反馈学习分类器

本研究提出了一种使用时间窗口假设下所有样本构建的无偏和凸实验风险来进行 DF 学习的方法，并在在线广告中进行了验证。

Sep, 2020

解决神经网络在 CTR 预测中的连续训练中的延迟反馈问题

本篇论文着重探讨如何在存在延迟标签的情况下，从连续的数据流中使用最佳的损失函数和模型进行大规模的学习。通过离线和在线实验的结果，论文得出了一种新的解决方案，可以优化 CTR，并提高广告主的性能。

Jul, 2019

延迟反馈下的转化率预测中反馈偏移校正

本文提出了使用重要性权重方法解决广告展示中的条件分布差异问题，以提高转化率预测的准确性，在离线和在线实验中得到了良好的效果。

Feb, 2020

延迟反馈建模的多头在线学习

本研究提出了一种多头建模方法，通过将转化 quantizes 成多个时间窗口来解决线上广告转化预测中标签新鲜度和滞后性之间的挑战，并实验证明其在转化率（CVR）和每次点击价值（VPC）预测方面表现大大优于已知方法。

May, 2022

推荐系统中考虑后点击信息的广义延迟反馈模型

本文介绍了一种利用后点击行为来改善推荐系统的时效性的机器学习方法，提出了一个泛化延迟反馈模型，同时强调在训练过程中利用及时信号和信息质量的平衡来平衡时效性和样本复杂度等问题。在公共数据集上进行的实验验证了该方法的有效性。

Jun, 2022