Oct, 2012

赞助搜索的预算优化:MDP 中的屏蔽学习

TL;DR本研究考虑广告主在参加重复竞价搜索拍卖时所面临的预算优化问题,将其作为带有被审查观测的马尔可夫决策过程(MDP)来建模,并提出基于 Kaplan-Meier 或产物极限估计器的学习算法。在微软广告中心的大量搜索竞拍数据上,将此算法与几种其他算法进行比较,证明其快速收敛的最佳性能。