推进广告拍卖逼真度:实践见解和建模影响
本文提出了一种在线学习框架,利用多维度的决策变量、赌博反馈和长期不确定性约束,帮助广告客户在非平稳采购结果的真实赌博反馈环境中动态优化广告平台的杠杆决策,取得低损失结果。
Jul, 2023
本文探讨了在实时竞价广告投放中,利用强化学习算法,通过状态空间表示广告拍卖信息和实时参数,在竞价过程中动态分配预算,学习最优的出价策略以最大化广告业绩,并通过神经网络解决了实际应用中的可扩展性问题。
Jan, 2017
本文主要探讨了实时竞价广告中的投标策略优化问题及挑战,介绍了几种代表性的投标策略,重点讨论了基于强化学习的投标策略的研究进展和挑战,通过定量评估 iPinYou 数据集上几种代表性的投标策略的性能,总结了使用强化学习算法优化投标策略的一般步骤,并提出了建议。
Nov, 2022
本文提出了一种针对在线广告买卖市场的方法,以最大化广告主的总实用效益且满足预算限制,解决预算限制下不确定的、可能存在证明问题的一组拍卖中的投标最优策略问题,并对在线出价的情况进行了调查,算法在完全信息情况下的拍卖后悔为 $O (T^{3/4})$。我们证明了此方法优于现有的适应性 pacing 算法的合成和真实数据集上的累计后悔。
Jun, 2023
本文提出了一种结合深度学习和强化学习技术的实时竞价新方法,用于优化广告投放并提高成效,通过历史数据的比较验证了该方法的有效性和实用性,并对模型参数对算法表现的影响进行了研究。
May, 2023
本文提出一种有限制的广告拍卖框架,以确保广告展示给适当数量的敏感人群,解决广告平台可能存在的性别或种族歧视并最大化平台收益的问题。基于 Myerson 的经典工作,我们提出了一个优化的拍卖机制,并使用梯度下降算法解决了非凸问题,通过 A1 Yahoo 数据集实证证明该算法可以在在少量的收益损失和人群规模更改下,使每位广告主获得统一的覆盖率。
Jan, 2019
通过离线强化学习从真实数据中学习,我们提出了一种通用方法来优化生产环境中的竞价策略,这种方法可以用于优化任何可微分的基础策略,并且只需要由基础策略自身生成的数据。我们使用混合代理架构将任意基础策略与深度神经网络结合起来,在训练后仅部署优化的基础策略参数,而神经网络部分被丢弃。我们证明这样的架构在模拟和生产竞价环境中都能取得统计上显著的性能提升。我们的方法不会产生额外的基础设施、安全或可解释性成本,因为它直接优化现有生产流程的参数,而不是用类似神经网络的黑箱模型替换它们。
Oct, 2023
本文讨论了如何利用多智能体强化学习进行实时广告优化,提出了一种聚类算法分配策略代理,并通过行业实验表明,与单一代理和实验算法相比,基于聚类的竞价模型具有更好的效果。
Feb, 2018
在复杂拍卖场景中,我们提出了一种在线学习方法,通过利用投标方的效用结构和部分反馈,为拍卖算法提供对最佳固定竞标的遗憾率,这对于行动空间的依赖程度来说比应用通用的贝叶斯智能带宽算法要快指数级收敛,同时又几乎等同于在完全信息环境下所实现的收敛,这些结果是通过分析这一新的基于反馈的在线学习方法实现的。
Nov, 2017