动态定价和长期参考效应的学习

Feb, 2024

Dynamic Pricing and Learning with Long-term Reference Effects

Shipra Agrawal, Wei Tang

TL;DR在这篇研究论文中，我们研究了动态定价问题，其中客户对当前价格的反应受到客户的价格期望（参考价格）的影响。我们研究了一种简单而新颖的参考价格机制，其中参考价格是卖方过去所提供的价格的平均值。我们证明，在这种机制下，降价政策是近乎最优的，无论模型的参数如何。此外，我们提供了线性需求模型下近乎最优降价政策的详细特征描述，并提供了一种高效的计算方法。然后，我们考虑了一种更具挑战性的动态定价和学习问题，其中需求模型参数是先验未知的，卖方需要从客户对所提供价格的反应中在线学习这些参数，并同时优化收入。我们的目标是最小化遗憾，即与卓越最优政策相比，T 轮收入损失。对于线性需求模型，我们提供了一个高效的学习算法，并得到了一个最优的 Ο(√T) 遗憾上界。

Abstract

We consider a dynamic pricing problem where customer response to the current price is impacted by the customer price expectation, aka reference price. We study a simple and novel →

dynamic pricing reference price markdown policy demand models regret minimization

发现论文，激发创造

贝叶斯劝服下的动态定价与学习

该研究探讨在线广告和动态定价设计的问题，使用贝叶斯说服模型来研究信号对买家定价和购买决策的影响，提出了一种具有低后悔率的在线算法。

Apr, 2023

电商生鲜零售中的 Markdown：一种反事实预测和多期优化方法

该论文提出了一种新的基于数据驱动和可解释的降价定价策略，使用半参数结构模型进行反事实预测和多期价格优化，并采用随机模型建立顺序定价策略。

May, 2021

高维下的动态定价

研究了一个销售大量产品的公司所面临的定价问题，提出了一种基于稀疏结构的动态策略，称为正则化最大似然定价，其能在 log T 的复杂度下最小化收益损失。

Sep, 2016

基于在线评论的贝叶斯动态定价

当发布新产品时，企业面临市场接受程度的不确定性。在线评论不仅为消费者提供宝贵信息，也为企业提供了调整产品特性（包括售价）的机会。本文考虑了带有在线评论的定价模型，其中产品的质量不确定，卖方和买方通过贝叶斯方法更新信念以做出购买和定价决策。我们将卖方的定价问题建模为基本的赌博机问题，并展示了与著名的卡塔兰数之间的密切关系，使我们能够有效计算卖方的整体未来折扣奖励。利用这个工具，我们在产品质量的有效学习概率方面分析和比较了最优静态和动态定价策略。

Apr, 2024

上下文动态定价：算法、优化和局部差分隐私约束

研究了上下文动态定价问题，探讨了需求模型、遗憾上限的最优化和隐私保护对动态定价的影响。

Jun, 2024

隐私保护的动态个性化定价与需求学习

本文提出动态定价模型，以差分隐私保护个人信息并最大化利润，通过引入 anticipanting (ε, δ)- 差分隐私的概念，在个性化信息被对手攻击的情况下，实现了可接受的收益和隐私保护水平，保护了客户的个人信息，实现最大化的收益。

Sep, 2020

具有战略买家的情境动态定价

个性化定价策略探讨了与策略性购买者的上下文动态定价问题，并提出了一个战略动态定价策略，该策略能够最大化卖方的累积收入，并能同时估计估值参数和成本参数，从而达到 O (sqrt (T)) 的遗憾上界。

Jul, 2023

有限供应下的动态定价

考虑具有有限供应的动态定价问题，研究非依赖事先信息的机制，与依赖事先信息的机制进行对比分析，最终利用多臂老虎机方法提出了可行的动态定价机制，该机制的收益与离线基准相差最多 O ((k log n)^(2/3))，在 k/n 足够小的情况下，该机制的表现可以被提高到 O (√k log n)。

Aug, 2011

改进的上下文动态定价算法

在此研究中，我们探讨了上下文动态定价的关键问题，提出了两种估值模型，并针对线性性假设和期望买家估值问题分别设计了算法，以实现较低的后悔率。

Jun, 2024

动态激励感知学习：上下文拍卖中的鲁棒性定价

本文提出了一种学习策略，通过观察过去的销售数据来设定保留价格，以最小化对收入的后悔，同时本文也探讨了市场噪声分布已知和未知情况下的学习政策和保留价格的设计。

Feb, 2020