非静态自动竞标世界中的在线广告采购
本文提出了一种针对在线广告买卖市场的方法,以最大化广告主的总实用效益且满足预算限制,解决预算限制下不确定的、可能存在证明问题的一组拍卖中的投标最优策略问题,并对在线出价的情况进行了调查,算法在完全信息情况下的拍卖后悔为 $O (T^{3/4})$。我们证明了此方法优于现有的适应性 pacing 算法的合成和真实数据集上的累计后悔。
Jun, 2023
通过离线强化学习从真实数据中学习,我们提出了一种通用方法来优化生产环境中的竞价策略,这种方法可以用于优化任何可微分的基础策略,并且只需要由基础策略自身生成的数据。我们使用混合代理架构将任意基础策略与深度神经网络结合起来,在训练后仅部署优化的基础策略参数,而神经网络部分被丢弃。我们证明这样的架构在模拟和生产竞价环境中都能取得统计上显著的性能提升。我们的方法不会产生额外的基础设施、安全或可解释性成本,因为它直接优化现有生产流程的参数,而不是用类似神经网络的黑箱模型替换它们。
Oct, 2023
在线广告拍卖的学习模型揭示了竞价人行为对关键绩效指标的影响,包括广告槽位置、竞争广告商数量和身份、广告商接收的反馈以及支付规则等特征。同时证明了在更现实的拍卖环境中,即使竞标人来自同一人群,提供 “软底价” 也能提升关键绩效指标。
Jul, 2023
本文探讨了在实时竞价广告投放中,利用强化学习算法,通过状态空间表示广告拍卖信息和实时参数,在竞价过程中动态分配预算,学习最优的出价策略以最大化广告业绩,并通过神经网络解决了实际应用中的可扩展性问题。
Jan, 2017
本论文提出了一个综合的学习出价框架 Bidding Machine,能够联合优化估算广告效用、预测市场价值、制定最佳竞标策略三个挑战,大大提高了广告活动的效益和利润。
Mar, 2018
在复杂拍卖场景中,我们提出了一种在线学习方法,通过利用投标方的效用结构和部分反馈,为拍卖算法提供对最佳固定竞标的遗憾率,这对于行动空间的依赖程度来说比应用通用的贝叶斯智能带宽算法要快指数级收敛,同时又几乎等同于在完全信息环境下所实现的收敛,这些结果是通过分析这一新的基于反馈的在线学习方法实现的。
Nov, 2017
电子商务平台上的广告拍卖和分配过程对广告收入和总商品交易量有直接影响,存在两个问题:广告拍卖阶段不考虑外部因素(例如实际显示位置和上下文对广告点击率的影响),广告分配阶段无法实现广告的激励兼容性。以往的研究多关注其中一个阶段,忽视了这个两个阶段的问题,从而导致了次优的结果。
Jan, 2024
本文研究了协同在线竞标算法在具有预算限制的重复次数第二价格拍卖中的效率,提出保证每个客户比独立竞标获得更高效用价值的算法,并以在线学习和均衡分析为技术支持,实现与多维基准的竞争。
Jun, 2023
本文提出一种有限制的广告拍卖框架,以确保广告展示给适当数量的敏感人群,解决广告平台可能存在的性别或种族歧视并最大化平台收益的问题。基于 Myerson 的经典工作,我们提出了一个优化的拍卖机制,并使用梯度下降算法解决了非凸问题,通过 A1 Yahoo 数据集实证证明该算法可以在在少量的收益损失和人群规模更改下,使每位广告主获得统一的覆盖率。
Jan, 2019
本研究建立了一个通用的优化框架,用于设计动态在线市场中的自动竞价代理,该框架仅优化买家的利益,并对卖家施加的拍卖机制无动于衷,因此可以跨多个平台联合优化一组广告,并自动保证预算分配和出价策略的最优性。
Feb, 2022