对首价拍卖中的无懊悔学习者进行策略规划

Feb, 2024

对首价拍卖中的无懊悔学习者进行策略规划

Strategizing against No-Regret Learners in First-Price Auctions

Aviad Rubinstein, Junyao Zhao

TL;DR我们研究了重复的一阶售价拍卖和一般重复贝叶斯博弈的情况，在这种情况下，一个参与者（学习者）采用了一个无悔学习算法，而另一个参与者（优化者）在了解学习者的算法的情况下，策略化地追求自己的效用最大化。对于一类被称为基于均值的无悔学习算法，我们证明：（i）在标准（即完全信息）的一阶售价拍卖中，优化者不能获得超过 Stackelberg 效用的效用 -- 这是文献中的标准基准，但是（ii）在贝叶斯一阶售价拍卖中，存在优化者可以获得远高于 Stackelberg 效用的实例。另一方面，Mansour 等人（2022）证明了一类更复杂的算法，称为无多面体交换后悔算法可以将优化者的效用限制在任意重复贝叶斯博弈（包括贝叶斯一阶售价拍卖）的 Stackelberg 效用上，并提出是否有必要使用无多面体交换后悔算法来限制优化者的效用。对于一般的贝叶斯博弈，在一个合理且必要的条件下，我们证明了无多面体交换后悔算法确实是将优化者的效用限制在 Stackelberg 效用上的必要条件，从而回答了他们的开放性问题。对于贝叶斯一阶售价拍卖，我们通过利用贝叶斯一阶售价拍卖的结构给出了一个简单的改进标准算法来最小化多面体交换后悔。

Abstract

We study repeated first-price auctions and general repeated bayesian games between two players, where one player, the learner, employs a no-regret learning algorithm, and the other player, the optimizer, knowing

repeated first-price auctions bayesian games no-regret learning algorithms stackelberg utility no-polytope-swap-regret algorithms

发现论文，激发创造

应用于一价拍卖中出价的战略稳健学习算法

学习在重复的一价拍卖中进行投标是博弈论和机器学习之间的一个基本问题，我们提出了一种新颖的凸形式用于分析一价拍卖中的纯策略投标，并证明了我们的算法可以有效鼓励拍卖买家真实报价并且无法被巧言利用。

Feb, 2024

游戏学习对学习者是否有益？

研究了两个智能体在重复对局中报酬和悔恨之间的权衡，提出了一种广义均衡概念，讨论了不同对手情况下的最优战略和可行方案，探究了利用这种广义均衡学习最优策略的方法。

May, 2023

如何向无悔购买者销售

本文提出了针对单个买方的拍卖问题，探讨了在买方使用 no-regret 学习算法的情况下，卖方进行售价策略和收益最大化的方法。作者通过详细的论证和实验对不同算法和竞标策略下的最优拍卖方式进行了完整的刻画和比较。

Nov, 2017

具有预算和 ROI 约束的非真实拍卖的无悔算法

自动投标算法是广告主在在线广告平台上优化广告活动的方式之一，本研究通过设计在线自动投标算法来实现广告主在预算和投资回报率限制下的价值最大化，研究还包括竞标优化、价值分布和成交价相关性等方面。

Apr, 2024

重复拍卖中无悔竞标算法的收敛分析

本文研究拍卖中的无悔出价算法的收敛性，发现如果投标人使用任何基于均值的学习规则，则投标人定价会在第二价格拍卖中高概率收敛到单纯纳什均衡，在多个物品拍卖的 VCG 拍卖中以及在第一价格拍卖中收敛到贝叶斯纳什均衡，实验证实了这些理论发现。

Sep, 2020

拍卖中的学习：遗憾很难，嫉妒很容易

本研究提出一种称为 “无嫉妒学习” 的拍卖学习概念，它是建立在 Walras 均衡基础上的，可有效实现且结果达到近似最优福利，即使投标人有分数次可减（XOS）估值或覆盖估值（无需具备要求），同时扩展到其他在文献中研究过的拍卖格式。

Nov, 2015

重复拍卖中的在线学习

该研究采用在线学习的方法，使用无差别反馈模型对 Vickrey 拍卖中的策略进行建模，对随机模型和对抗模型进行研究并设计相应的出价策略，为参与此类拍卖的竞标者提供了第一个完整的策略集。

Nov, 2015

具有战略买家的重复拍卖学习定价

我们研究了在线广告中的买方定价、多次交互和卖方算法，包括买方价值分布推断、策略性遗憾和卖方长期收入最大化。我们定义了策略性遗憾的自然概念，介绍了卖方算法，分析了买方的贴现能力。该文阐述了任何卖方算法在没有贴现时都将遭受线性策略性遗憾。

Nov, 2013

对抗非目光短浅竞拍者的学习最优储备价

本研究针对非近视竞标者在重复拍卖中可能会采取策略性出价以获得未来回合利益的情况下，研究了学习最优保留价格的问题和相关算法。我们提出的算法可以在市场较大（即没有竞标者出现在一组回合的固定比例）或竞标者不耐心的情况下（即他们将未来效用打折，其因子在 1 附近）实现小的后悔率，该方法精细控制每个标注者所可见的信息，并借鉴了差分隐私在线学习和联合差分隐私算法的技术。

Apr, 2018

遗憾最小化代理人之间的拍卖

本文研究一种情景，软件代理机器人实施后悔最小算法，代表他们的用户进行重复拍卖。研究一价和二价拍卖及其广义版本。使用理论分析和模拟，结果表明在二价拍卖中，玩家有激励向其自己的学习代理机器人提供不真实的估值，而在一价拍卖中，对于所有玩家真实报告其估值是一种占优策略。

Oct, 2021