具有上下文弹性和异方差估值的定价
本研究旨在探讨基于上下文的动态定价,采用一种新颖的扰动线性 bandit 框架来平衡市场噪音与当前知识的利用,学习上下文函数和市场噪音,证明了所述策略在扰动线性 bandit 框架下的遗憾上界和匹配下界,并且在模拟和现实场景中表现出卓越的性能。
Sep, 2021
通过可观察的产品特征和顾客特征,提出一种新算法,通过离散化未知噪声分布和上限置信区间与分层数据分区技术的组合,有效地调节每个周期中的懊悔,从而控制与定价决策相关的懊悔,实现极小极大优化。
Jun, 2024
个性化定价策略探讨了与策略性购买者的上下文动态定价问题,并提出了一个战略动态定价策略,该策略能够最大化卖方的累积收入,并能同时估计估值参数和成本参数,从而达到 O (sqrt (T)) 的遗憾上界。
Jul, 2023
本文介绍了一种新颖的上下文强化学习算法,用于在具有不确定需求的情况下,根据效用公平性约束进行个性化定价,实现最优的遗憾上限。我们的方法结合动态定价和需求学习,解决了定价策略中的公平性的关键挑战。我们通过数学分析和计算研究来表征受到公平性约束的最优上下文定价策略的结构,并导出了简化的策略,为更深入的研究和扩展打下了基础。此外,我们将研究扩展到具有需求学习的动态定价问题,建立了一个非标准的遗憾下界,突显了公平性约束增加的复杂性。我们的研究提供了公平性成本及其对效用和收入最大化之间平衡的影响的综合分析。本工作是将伦理考虑纳入基于数据驱动的动态定价算法效率的一个步骤。
Nov, 2023
当发布新产品时,企业面临市场接受程度的不确定性。在线评论不仅为消费者提供宝贵信息,也为企业提供了调整产品特性(包括售价)的机会。本文考虑了带有在线评论的定价模型,其中产品的质量不确定,卖方和买方通过贝叶斯方法更新信念以做出购买和定价决策。我们将卖方的定价问题建模为基本的赌博机问题,并展示了与著名的卡塔兰数之间的密切关系,使我们能够有效计算卖方的整体未来折扣奖励。利用这个工具,我们在产品质量的有效学习概率方面分析和比较了最优静态和动态定价策略。
Apr, 2024
本文提出了一种学习策略,通过观察过去的销售数据来设定保留价格,以最小化对收入的后悔,同时本文也探讨了市场噪声分布已知和未知情况下的学习政策和保留价格的设计。
Feb, 2020