- HiBid: 一个跨渠道约束竞价系统及预算分配的层次式离线深度强化学习
该研究提出了一种名为 HiBid 的层次离线深度强化学习框架,用于在线展示广告平台的交叉渠道受限出价及预算分配问题,并通过大规模日志数据和在线 A/B 测试验证了其在点击次数、CPC 满意度比率和投资回报率方面优于其他六种基准模型,并应用于 - 使用马尔可夫决策过程和机器学习技术改善在线广告实时竞价
本文提出了一种结合深度学习和强化学习技术的实时竞价新方法,用于优化广告投放并提高成效,通过历史数据的比较验证了该方法的有效性和实用性,并对模型参数对算法表现的影响进行了研究。
- AAAI展示广告中带有预算限制的自适应风险感知竞标
本研究提出了一种基于强化学习的新型自适应风险感知竞价算法,旨在同时考虑估计不确定性和 DSP 的动态风险倾向,并通过公共数据集的广泛实验表明,该算法在实际 setting 中优于现有的最佳方法。
- 展示广告领域的实时竞价策略:实证分析
本文主要探讨了实时竞价广告中的投标策略优化问题及挑战,介绍了几种代表性的投标策略,重点讨论了基于强化学习的投标策略的研究进展和挑战,通过定量评估 iPinYou 数据集上几种代表性的投标策略的性能,总结了使用强化学习算法优化投标策略的一般步 - 面向在线广告拍卖的可信 AI 实时竞价
本文系统分析了在线广告领域中关键的问题,提出建立可信赖的 AIRTB 关键技术的研究方向,并详细讨论了建立安全性、稳健性和公正性等三个维度的可信体系所需的策略,并探讨了未来研究的方向。
- 实时竞价的功能优化强化学习
本文提出了一种多智能体强化学习架构以用于实时竞价广告,使用三个 Lagrange 乘数基于功能优化以及一个基准代理程序进行竞标环境设计。实验结果表明,相比其他代理程序,具有功能优化的代理程序在广告竞标过程中获胜速率和盈余率上有显著提升,表现 - KDD基于课程引导的贝叶斯强化学习的 ROI 受限出价
该篇论文描述了如何使用部分可观测马尔可夫决策过程方法做到在高度动态的广告市场中,自适应平衡 ROI 约束和目标优化的需求并提出了一种调整策略的贝叶斯强化学习框架。
- 展示广告中的印象分配和政策搜索
该论文研究了优化在线展示广告销售策略,通过将印刷品分配问题转化为拍卖问题,并提出了多智能体强化学习方法来解决不稳定流量模式等挑战,最终证明该策略可行且有效。
- 离线强化学习在实时竞价和推荐中的加速应用:模拟的潜在应用
利用模拟来加速离线强化学习与行动评估的实证研究:探讨离线强化学习与行动评估的实证研究如何受益于模拟,并提供了在 RecSys 和 RTB 中进一步促进实证研究的开放挑战和解决方案。
- KDD通过胜率估计和剩余价值最大化进行出价压减
本文描述了一种基于胜率的出价阴影算法 (WR),使用修改的逻辑回归预测每种可能阴影出价价格的收益,可以快速最大化运行时效率,实现了比基准方法更高的广告主利润与更高的剩余价值,并可用于实时竞价系统。
- KDD基于 URL 嵌入的展示广告转化预测
本研究介绍了不同的模型来预测用户转化的概率,其中包括三个 URL 嵌入模型和转化预测模型,并通过实验数据证明了其有效性。
- KDDMoTiAC: 实时竞价的多目标演员 - 评论家算法
使用强化学习算法 (MoTiAC),提出了一种多目标 Actor-Critics 算法,用于在考虑展示成本、投资回报率和其他关键绩效指标的情况下进行投标优化,可以同时实现复杂竞标环境中的多目标任务,并证明其能够收敛到帕累托最优。此算法在一个 - 广告投放中的多变量控制竞价优化
本研究研究了在 RTB 环境下,广告主如何在预算限制的情况下最大化转化量,作者们通过使用线性规划和基于反馈控制方法来推导出最优出价策略,同时提出了多变量控制系统来解决应用问题,并使用淘宝真实数据进行了验证。
- 竞标机器:学习竞标直接优化展示广告收益
本论文提出了一个综合的学习出价框架 Bidding Machine,能够联合优化估算广告效用、预测市场价值、制定最佳竞标策略三个挑战,大大提高了广告活动的效益和利润。
- 深度强化学习在赞助搜索实时竞价中的应用
本文提出了一种基于强化学习的方法解决了在线广告拍卖中的实时竞标问题,特别是在搜索广告拍卖中针对多关键字的竞标策略提出了一个控制模型。
- 基于模型无关强化学习的广告展示的预算约束竞标
本研究提出一种基于强化学习的模型自由框架,将预算限制投标问题转化为马尔可夫决策过程,并采用深度神经网络学习适当的奖励 —— 从而优化决策策略 — 以在大规模真实数据集上执行 RTB 优化
- LADDER:大规模实时在线拍卖的人类水平竞价代理
LADDER 是一种基于 DASQN 的异步随机算法的深度强化学习代理,它能够成功地直接从包含高级语义信息的原始输入中学习大规模实际问题的控制策略,这种代理用于在线竞拍和广告领域,可以显著地提高公司的广告收益和广告主的投资回报率。
- 展示广告投标风险管理
本研究透過評估使用者行為不確定性和拍賣競爭中的成本不確定性來為 RTB 顯示廣告中的不確定性建立數學模型,推導出了兩種風險意識下的出價策略,此模型可有效提高广告投放的利润。
- WSDM展示广告中强化学习实时竞价
本文探讨了在实时竞价广告投放中,利用强化学习算法,通过状态空间表示广告拍卖信息和实时参数,在竞价过程中动态分配预算,学习最优的出价策略以最大化广告业绩,并通过神经网络解决了实际应用中的可扩展性问题。
- 实时竞价(RTB)和行为定向的展示广告
本文概述了计算广告的新领域所涉及的基本基础设施、算法和技术解决方案,其中涵盖了实时竞价、数字营销、自动化、信息检索、广告欺诈检测等主题。