Feb, 2018

基于模型无关强化学习的广告展示的预算约束竞标

TL;DR本研究提出一种基于强化学习的模型自由框架,将预算限制投标问题转化为马尔可夫决策过程,并采用深度神经网络学习适当的奖励 —— 从而优化决策策略 — 以在大规模真实数据集上执行 RTB 优化