IJCAIMay, 2024

基于后验抽样的时变需求收入管理学习

TL;DR本研究讨论了收益管理问题,通过定价商品或服务最大化收益。研究挑战之一是在真实应用中(如航空和零售行业)需求分布未知且随时间变化。为解决此问题,我们首先引入了一种基于典型应用场景的分段泛化收益管理问题,并提出了一种基于后验抽样的计算高效算法。我们推导了这种算法在需求参数可以在时间段之间相关的一般模型中的贝叶斯遗憾上界,同时推导了一种通用算法的遗憾下界。我们的实证研究表明,所提算法优于其他基准算法,并与事后最优策略具有可比性。我们还提出了所提算法的一种启发式修改,该修改在实验中进一步高效地学习定价策略。