Feb, 2024

动态定价和长期参考效应的学习

TL;DR在这篇研究论文中,我们研究了动态定价问题,其中客户对当前价格的反应受到客户的价格期望(参考价格)的影响。我们研究了一种简单而新颖的参考价格机制,其中参考价格是卖方过去所提供的价格的平均值。我们证明,在这种机制下,降价政策是近乎最优的,无论模型的参数如何。此外,我们提供了线性需求模型下近乎最优降价政策的详细特征描述,并提供了一种高效的计算方法。然后,我们考虑了一种更具挑战性的动态定价和学习问题,其中需求模型参数是先验未知的,卖方需要从客户对所提供价格的反应中在线学习这些参数,并同时优化收入。我们的目标是最小化遗憾,即与卓越最优政策相比,T 轮收入损失。对于线性需求模型,我们提供了一个高效的学习算法,并得到了一个最优的 Ο(√T) 遗憾上界。