学习针对移动目标进行定价

ICMLJun, 2021

Learning to Price Against a Moving Target

Renato Paes Leme, Balasubramanian Sivan, Yifeng Teng, Pratik Worah

TL;DR本文探讨在 Learning to Price 的环境下，当买家估值是一个移动目标的情况下，寻找一种使卖家能最大化收益的算法，并提供了对于最优收益损失的上下界限制。由于目标一直在移动，所以算法必须在探索和利用之间不断切换来保持最新的信息。

Abstract

In the learning to price setting, a seller posts prices over time with the goal of maximizing revenue while learning the buyer's valuation. This problem is very well understood when values are stationary (fixed or iid). Here we study the problem where the buyer's value is a

learning to price revenue maximization moving target stochastic process exploration-exploitation trade-off

发现论文，激发创造

贝叶斯劝服下的动态定价与学习

该研究探讨在线广告和动态定价设计的问题，使用贝叶斯说服模型来研究信号对买家定价和购买决策的影响，提出了一种具有低后悔率的在线算法。

Apr, 2023

动态定价和长期参考效应的学习

在这篇研究论文中，我们研究了动态定价问题，其中客户对当前价格的反应受到客户的价格期望（参考价格）的影响。我们研究了一种简单而新颖的参考价格机制，其中参考价格是卖方过去所提供的价格的平均值。我们证明，在这种机制下，降价政策是近乎最优的，无论模型的参数如何。此外，我们提供了线性需求模型下近乎最优降价政策的详细特征描述，并提供了一种高效的计算方法。然后，我们考虑了一种更具挑战性的动态定价和学习问题，其中需求模型参数是先验未知的，卖方需要从客户对所提供价格的反应中在线学习这些参数，并同时优化收入。我们的目标是最小化遗憾，即与卓越最优政策相比，T 轮收入损失。对于线性需求模型，我们提供了一个高效的学习算法，并得到了一个最优的 Ο(√T) 遗憾上界。

Feb, 2024

有限未知估值的动态定价

本文提出了针对动态定价情况下买家分组的拍卖模型，通过对分布无关和分布相关情况进行分析，得到了买家估价分布的上下界，提出了一种上界近似算法，并给出了其退化情况的解法。

Jul, 2018

具有战略买家的重复拍卖学习定价

我们研究了在线广告中的买方定价、多次交互和卖方算法，包括买方价值分布推断、策略性遗憾和卖方长期收入最大化。我们定义了策略性遗憾的自然概念，介绍了卖方算法，分析了买方的贴现能力。该文阐述了任何卖方算法在没有贴现时都将遭受线性策略性遗憾。

Nov, 2013

经纪人的在线学习理论

在线学习视角下研究交易者间的经纪服务，在不同情况下，通过算法实现不同的后悔率和界定密度。

Oct, 2023

动态激励感知学习：上下文拍卖中的鲁棒性定价

本文提出了一种学习策略，通过观察过去的销售数据来设定保留价格，以最小化对收入的后悔，同时本文也探讨了市场噪声分布已知和未知情况下的学习政策和保留价格的设计。

Feb, 2020

有限供应下的动态定价

考虑具有有限供应的动态定价问题，研究非依赖事先信息的机制，与依赖事先信息的机制进行对比分析，最终利用多臂老虎机方法提出了可行的动态定价机制，该机制的收益与离线基准相差最多 O ((k log n)^(2/3))，在 k/n 足够小的情况下，该机制的表现可以被提高到 O (√k log n)。

Aug, 2011

改进的上下文动态定价算法

在此研究中，我们探讨了上下文动态定价的关键问题，提出了两种估值模型，并针对线性性假设和期望买家估值问题分别设计了算法，以实现较低的后悔率。

Jun, 2024

半参数动态情境定价

基于实时定价与上下文信息，本文提出了一种半参数模型，能够通过回归参数和残差分布来最大化收益，考虑到了细节特征。

Jan, 2019

如何向无悔购买者销售

本文提出了针对单个买方的拍卖问题，探讨了在买方使用 no-regret 学习算法的情况下，卖方进行售价策略和收益最大化的方法。作者通过详细的论证和实验对不同算法和竞标策略下的最优拍卖方式进行了完整的刻画和比较。

Nov, 2017