Rec4Ad: 淘宝广告 CTR 预测中减轻样本选择偏差的免费午餐

Jun, 2023

Rec4Ad: 淘宝广告 CTR 预测中减轻样本选择偏差的免费午餐

Rec4Ad: A Free Lunch to Mitigate Sample Selection Bias for Ads CTR Prediction in Taobao

Jingyue Gao, Shuguang Han, Han Zhu, Siran Yang, Yuning Jiang...

TL;DR本文提出了一种基于数据增强和自对齐分离的方法 Rec4Ad，利用有机推荐物品和赞助物品的混合结果缓解广告 CTR 模型中的样本选择偏差，实现了在淘宝广告系统中 CTR 和 RPM 的显著提高。

Abstract

Click-Through Rate (CTR) prediction serves as a fundamental component in online advertising. A common practice is to train a CTR model on advertisement (ad) impressions with user feedback. Since ad impressions are purposely selected by the model itself, their distribution differs from the inference distribution and thus exhibits →

click-through rate prediction sample selection bias uniform-data-free framework data augmentation rec4ad

发现论文，激发创造

广告竞拍中点击率预测的改进在线学习算法

我们研究了在线学习问题中的广告拍卖收入最大化问题，重点关注广告主的战略行为、点击率和动态估值对机制表现的影响。

Feb, 2024

电商中优化赞助产品的实用经验

本文研究赞助产品优化中的多个问题，包括基于位置的去偏差、点击 - 转化多任务学习和预测点击率（pCTR）的校准。我们提出了一个实用的机器学习框架，可以解决这些问题，而不改变现有机器学习模型的结构，并可以与大多数机器学习模型结合使用。我们在真实世界的在线购物网站上评估了我们的提出的实用框架，证明它可以解决广告系统中的固有问题，并为多个评估指标带来增益。

Apr, 2023

知识蒸馏下的位置偏差建模思考与 CTR 预测

提出一种基于知识蒸馏的简单而高效的方法，以缓解位置偏差的影响，利用位置信息来提高 CTR 预测性能。在真实世界的生产数据集和在线 A/B 测试中，该方法取得了显著的性能改善，并已在全球最大电商平台的主要流量服务中部署。

Apr, 2022

关于 CTR 预测中概念漂移的适应性

本文提出了一种新的自适应专家混合（AdaMoE）框架，通过对 CTR 预测数据流中的统计加权策略来缓解概念漂移问题，并通过基准和实际工业数据集的大量离线实验以及在线 A / B 测试表明，AdaMoE 明显胜过所有考虑的增量学习框架。

Apr, 2022

基于表示学习的点击率预测

DeepMCP 模型基于匹配、关联和预测三个子网络，可以更准确地预测在线广告系统中的 CTR，并在两个大型数据集上优于现有的人工智能模型。

Jun, 2019

再看 CTR 预测：关注全部需求吗？

本文旨在使用经济学中的离散选择模型对点击率 (CTR) 预测问题进行重新定义，并提出了一种使用自注意力机制构建的通用神经网络框架，该框架与现有的大多数 CTR 预测模型相一致，同时还考虑了模型的表达能力和复杂性，最后通过一些公共数据集上的实验结果证明了我们提出的见解。

May, 2021

CL4CTR: 用于 CTR 预测的对比学习框架

本文提出了一种基于自监督学习的 Click-Through Rate (CTR) 预测框架 (CL4CTR)，采用三种自监督学习信号作为特征表征学习的正则化项以提高 CTR 预测性能，并在四个数据集上实验证明其与各种代表性基线相比具有卓越的性能和兼容性。

Dec, 2022

通过 Tabular Learning 实现发展中国家的高效点击率预测

本研究旨在通过建立点击率预测任务与表格学习之间的联系，证明表格学习模型在 CTR 预测中比超参数化 CTR 预测模型更高效、更有效，并通过 8 个公共 CTR 预测数据集上的实验以及实际在线应用的 A / B 测试，证明这种模型不仅可以提高离线性能，还可以提高真实用户的 CTR。

Apr, 2021

始终强化优势：基于漂移感知的增量学习框架用于 CTR 预测

本文提出了一种基于集成学习的漂移感知增量学习框架，通过明确基于错误的流数据漂移检测，进一步加强适应良好的集合，并冻结不匹配的集合，避免了灾难性干预，从而解决了 CTR 预测中的灾难性遗忘问题。离线实验和 A/B 测试结果表明，该方法优于所有基线方法。

Apr, 2023

RAT：检索增强转换器用于点击率预测

通过检索式转换器建立内部和跨样本特征交互，用于点击率预测，提高预测效果并保持高效性。

Apr, 2024