Nov, 2023

背景动态定价中的公平性与需求学习

TL;DR本文介绍了一种新颖的上下文强化学习算法,用于在具有不确定需求的情况下,根据效用公平性约束进行个性化定价,实现最优的遗憾上限。我们的方法结合动态定价和需求学习,解决了定价策略中的公平性的关键挑战。我们通过数学分析和计算研究来表征受到公平性约束的最优上下文定价策略的结构,并导出了简化的策略,为更深入的研究和扩展打下了基础。此外,我们将研究扩展到具有需求学习的动态定价问题,建立了一个非标准的遗憾下界,突显了公平性约束增加的复杂性。我们的研究提供了公平性成本及其对效用和收入最大化之间平衡的影响的综合分析。本工作是将伦理考虑纳入基于数据驱动的动态定价算法效率的一个步骤。