半参数动态情境定价
本研究旨在探讨基于上下文的动态定价,采用一种新颖的扰动线性 bandit 框架来平衡市场噪音与当前知识的利用,学习上下文函数和市场噪音,证明了所述策略在扰动线性 bandit 框架下的遗憾上界和匹配下界,并且在模拟和现实场景中表现出卓越的性能。
Sep, 2021
通过可观察的产品特征和顾客特征,提出一种新算法,通过离散化未知噪声分布和上限置信区间与分层数据分区技术的组合,有效地调节每个周期中的懊悔,从而控制与定价决策相关的懊悔,实现极小极大优化。
Jun, 2024
本文提出了一种学习策略,通过观察过去的销售数据来设定保留价格,以最小化对收入的后悔,同时本文也探讨了市场噪声分布已知和未知情况下的学习政策和保留价格的设计。
Feb, 2020
我们研究了一种在线上下文动态定价问题,介绍了一种以特征为基础的价格弹性建模方法,提出了一种高效的算法 “Pricing with Perturbation (PwP)”,并证明了其在任意敌对背景输入序列下的最佳性及相应的复杂度。该研究结果揭示了上下文弹性与异方差性估价之间的关系,为有效和实用的定价策略提供了启示。
Dec, 2023
个性化定价策略探讨了与策略性购买者的上下文动态定价问题,并提出了一个战略动态定价策略,该策略能够最大化卖方的累积收入,并能同时估计估值参数和成本参数,从而达到 O (sqrt (T)) 的遗憾上界。
Jul, 2023
本文介绍了一种新颖的上下文强化学习算法,用于在具有不确定需求的情况下,根据效用公平性约束进行个性化定价,实现最优的遗憾上限。我们的方法结合动态定价和需求学习,解决了定价策略中的公平性的关键挑战。我们通过数学分析和计算研究来表征受到公平性约束的最优上下文定价策略的结构,并导出了简化的策略,为更深入的研究和扩展打下了基础。此外,我们将研究扩展到具有需求学习的动态定价问题,建立了一个非标准的遗憾下界,突显了公平性约束增加的复杂性。我们的研究提供了公平性成本及其对效用和收入最大化之间平衡的影响的综合分析。本工作是将伦理考虑纳入基于数据驱动的动态定价算法效率的一个步骤。
Nov, 2023