如何向无悔购买者销售

Nov, 2017

Selling to a No-Regret Buyer

Mark Braverman, Jieming Mao, Jon Schneider, S. Matthew Weinberg

TL;DR本文提出了针对单个买方的拍卖问题，探讨了在买方使用 no-regret 学习算法的情况下，卖方进行售价策略和收益最大化的方法。作者通过详细的论证和实验对不同算法和竞标策略下的最优拍卖方式进行了完整的刻画和比较。

Abstract

We consider the problem of a single seller repeatedly selling a single item to a single buyer (specifically, the buyer has a value drawn fresh from known distribution $D$ in every round). Prior work assumes that the buyer is fully rational and will perfectly reason about how their bids today affect the seller's decisions tomorrow. In this work we initiate a

auction theory learning algorithms pricing strategies revenue optimization game theory

发现论文，激发创造

具有战略买家的重复拍卖学习定价

我们研究了在线广告中的买方定价、多次交互和卖方算法，包括买方价值分布推断、策略性遗憾和卖方长期收入最大化。我们定义了策略性遗憾的自然概念，介绍了卖方算法，分析了买方的贴现能力。该文阐述了任何卖方算法在没有贴现时都将遭受线性策略性遗憾。

Nov, 2013

对抗非目光短浅竞拍者的学习最优储备价

本研究针对非近视竞标者在重复拍卖中可能会采取策略性出价以获得未来回合利益的情况下，研究了学习最优保留价格的问题和相关算法。我们提出的算法可以在市场较大（即没有竞标者出现在一组回合的固定比例）或竞标者不耐心的情况下（即他们将未来效用打折，其因子在 1 附近）实现小的后悔率，该方法精细控制每个标注者所可见的信息，并借鉴了差分隐私在线学习和联合差分隐私算法的技术。

Apr, 2018

对首价拍卖中的无懊悔学习者进行策略规划

我们研究了重复的一阶售价拍卖和一般重复贝叶斯博弈的情况，在这种情况下，一个参与者（学习者）采用了一个无悔学习算法，而另一个参与者（优化者）在了解学习者的算法的情况下，策略化地追求自己的效用最大化。对于一类被称为基于均值的无悔学习算法，我们证明：（i）在标准（即完全信息）的一阶售价拍卖中，优化者不能获得超过 Stackelberg 效用的效用 -- 这是文献中的标准基准，但是（ii）在贝叶斯一阶售价拍卖中，存在优化者可以获得远高于 Stackelberg 效用的实例。另一方面，Mansour 等人（2022）证明了一类更复杂的算法，称为无多面体交换后悔算法可以将优化者的效用限制在任意重复贝叶斯博弈（包括贝叶斯一阶售价拍卖）的 Stackelberg 效用上，并提出是否有必要使用无多面体交换后悔算法来限制优化者的效用。对于一般的贝叶斯博弈，在一个合理且必要的条件下，我们证明了无多面体交换后悔算法确实是将优化者的效用限制在 Stackelberg 效用上的必要条件，从而回答了他们的开放性问题。对于贝叶斯一阶售价拍卖，我们通过利用贝叶斯一阶售价拍卖的结构给出了一个简单的改进标准算法来最小化多面体交换后悔。

Feb, 2024

重复拍卖中无悔竞标算法的收敛分析

本文研究拍卖中的无悔出价算法的收敛性，发现如果投标人使用任何基于均值的学习规则，则投标人定价会在第二价格拍卖中高概率收敛到单纯纳什均衡，在多个物品拍卖的 VCG 拍卖中以及在第一价格拍卖中收敛到贝叶斯纳什均衡，实验证实了这些理论发现。

Sep, 2020

带有策略性买家的一口价拍卖中的收益优化

该研究针对公告价格拍卖中存在的策略买家，研究了收入最优化的学习算法，提出了一种新的算法，相较于之前最好的算法，在减小策略遗憾度方面有指数级改善，且表现优于现有技术。

Nov, 2014

应用于一价拍卖中出价的战略稳健学习算法

学习在重复的一价拍卖中进行投标是博弈论和机器学习之间的一个基本问题，我们提出了一种新颖的凸形式用于分析一价拍卖中的纯策略投标，并证明了我们的算法可以有效鼓励拍卖买家真实报价并且无法被巧言利用。

Feb, 2024

具有预算和 ROI 约束的非真实拍卖的无悔算法

自动投标算法是广告主在在线广告平台上优化广告活动的方式之一，本研究通过设计在线自动投标算法来实现广告主在预算和投资回报率限制下的价值最大化，研究还包括竞标优化、价值分布和成交价相关性等方面。

Apr, 2024

动态激励感知学习：上下文拍卖中的鲁棒性定价

本文提出了一种学习策略，通过观察过去的销售数据来设定保留价格，以最小化对收入的后悔，同时本文也探讨了市场噪声分布已知和未知情况下的学习政策和保留价格的设计。

Feb, 2020

重复多单位按竞标付费拍卖中的学习

通过离线动态规划方案，设计了在线学习算法以解决多次多单位逐标付款拍卖中的出价问题，并获得关于遗憾上界的结果，研究表明这种拍卖方式产生更高的收入。

Jul, 2023

重复拍卖中的在线学习

该研究采用在线学习的方法，使用无差别反馈模型对 Vickrey 拍卖中的策略进行建模，对随机模型和对抗模型进行研究并设计相应的出价策略，为参与此类拍卖的竞标者提供了第一个完整的策略集。

Nov, 2015