AAAIDec, 2022

展示广告中带有预算限制的自适应风险感知竞标

TL;DR本研究提出了一种基于强化学习的新型自适应风险感知竞价算法,旨在同时考虑估计不确定性和 DSP 的动态风险倾向,并通过公共数据集的广泛实验表明,该算法在实际 setting 中优于现有的最佳方法。