Rec4Ad: 淘宝广告 CTR 预测中减轻样本选择偏差的免费午餐
本文研究赞助产品优化中的多个问题,包括基于位置的去偏差、点击 - 转化多任务学习和预测点击率(pCTR)的校准。我们提出了一个实用的机器学习框架,可以解决这些问题,而不改变现有机器学习模型的结构,并可以与大多数机器学习模型结合使用。我们在真实世界的在线购物网站上评估了我们的提出的实用框架,证明它可以解决广告系统中的固有问题,并为多个评估指标带来增益。
Apr, 2023
提出一种基于知识蒸馏的简单而高效的方法,以缓解位置偏差的影响,利用位置信息来提高 CTR 预测性能。在真实世界的生产数据集和在线 A/B 测试中,该方法取得了显著的性能改善,并已在全球最大电商平台的主要流量服务中部署。
Apr, 2022
本文提出了一种新的自适应专家混合(AdaMoE)框架,通过对 CTR 预测数据流中的统计加权策略来缓解概念漂移问题,并通过基准和实际工业数据集的大量离线实验以及在线 A / B 测试表明,AdaMoE 明显胜过所有考虑的增量学习框架。
Apr, 2022
本文旨在使用经济学中的离散选择模型对点击率 (CTR) 预测问题进行重新定义,并提出了一种使用自注意力机制构建的通用神经网络框架,该框架与现有的大多数 CTR 预测模型相一致,同时还考虑了模型的表达能力和复杂性,最后通过一些公共数据集上的实验结果证明了我们提出的见解。
May, 2021
本文提出了一种基于自监督学习的 Click-Through Rate (CTR) 预测框架 (CL4CTR),采用三种自监督学习信号作为特征表征学习的正则化项以提高 CTR 预测性能,并在四个数据集上实验证明其与各种代表性基线相比具有卓越的性能和兼容性。
Dec, 2022
本研究旨在通过建立点击率预测任务与表格学习之间的联系,证明表格学习模型在 CTR 预测中比超参数化 CTR 预测模型更高效、更有效,并通过 8 个公共 CTR 预测数据集上的实验以及实际在线应用的 A / B 测试,证明这种模型不仅可以提高离线性能,还可以提高真实用户的 CTR。
Apr, 2021
本文提出了一种基于集成学习的漂移感知增量学习框架,通过明确基于错误的流数据漂移检测,进一步加强适应良好的集合,并冻结不匹配的集合,避免了灾难性干预,从而解决了 CTR 预测中的灾难性遗忘问题。离线实验和 A/B 测试结果表明,该方法优于所有基线方法。
Apr, 2023