Dec, 2023
HiBid: 一个跨渠道约束竞价系统及预算分配的层次式离线深度强化学习
HiBid: A Cross-Channel Constrained Bidding System with Budget Allocation by Hierarchical Offline Deep Reinforcement Learning
Hao Wang, Bo Tang, Chi Harold Liu, Shangqin Mao, Jiahong Zhou...
TL;DR该研究提出了一种名为 HiBid 的层次离线深度强化学习框架,用于在线展示广告平台的交叉渠道受限出价及预算分配问题,并通过大规模日志数据和在线 A/B 测试验证了其在点击次数、CPC 满意度比率和投资回报率方面优于其他六种基准模型,并应用于美团广告平台服务数以万计的广告商。