如何向无悔购买者销售
我们研究了在线广告中的买方定价、多次交互和卖方算法,包括买方价值分布推断、策略性遗憾和卖方长期收入最大化。我们定义了策略性遗憾的自然概念,介绍了卖方算法,分析了买方的贴现能力。该文阐述了任何卖方算法在没有贴现时都将遭受线性策略性遗憾。
Nov, 2013
本研究针对非近视竞标者在重复拍卖中可能会采取策略性出价以获得未来回合利益的情况下,研究了学习最优保留价格的问题和相关算法。我们提出的算法可以在市场较大(即没有竞标者出现在一组回合的固定比例)或竞标者不耐心的情况下(即他们将未来效用打折,其因子在 1 附近)实现小的后悔率,该方法精细控制每个标注者所可见的信息,并借鉴了差分隐私在线学习和联合差分隐私算法的技术。
Apr, 2018
我们研究了重复的一阶售价拍卖和一般重复贝叶斯博弈的情况,在这种情况下,一个参与者(学习者)采用了一个无悔学习算法,而另一个参与者(优化者)在了解学习者的算法的情况下,策略化地追求自己的效用最大化。 对于一类被称为基于均值的无悔学习算法,我们证明:(i)在标准(即完全信息)的一阶售价拍卖中,优化者不能获得超过 Stackelberg 效用的效用 -- 这是文献中的标准基准,但是(ii)在贝叶斯一阶售价拍卖中,存在优化者可以获得远高于 Stackelberg 效用的实例。 另一方面,Mansour 等人(2022)证明了一类更复杂的算法,称为无多面体交换后悔算法可以将优化者的效用限制在任意重复贝叶斯博弈(包括贝叶斯一阶售价拍卖)的 Stackelberg 效用上,并提出是否有必要使用无多面体交换后悔算法来限制优化者的效用。对于一般的贝叶斯博弈,在一个合理且必要的条件下,我们证明了无多面体交换后悔算法确实是将优化者的效用限制在 Stackelberg 效用上的必要条件,从而回答了他们的开放性问题。对于贝叶斯一阶售价拍卖,我们通过利用贝叶斯一阶售价拍卖的结构给出了一个简单的改进标准算法来最小化多面体交换后悔。
Feb, 2024
本文研究拍卖中的无悔出价算法的收敛性,发现如果投标人使用任何基于均值的学习规则,则投标人定价会在第二价格拍卖中高概率收敛到单纯纳什均衡,在多个物品拍卖的 VCG 拍卖中以及在第一价格拍卖中收敛到贝叶斯纳什均衡,实验证实了这些理论发现。
Sep, 2020
该研究针对公告价格拍卖中存在的策略买家,研究了收入最优化的学习算法,提出了一种新的算法,相较于之前最好的算法,在减小策略遗憾度方面有指数级改善,且表现优于现有技术。
Nov, 2014
学习在重复的一价拍卖中进行投标是博弈论和机器学习之间的一个基本问题,我们提出了一种新颖的凸形式用于分析一价拍卖中的纯策略投标,并证明了我们的算法可以有效鼓励拍卖买家真实报价并且无法被巧言利用。
Feb, 2024
自动投标算法是广告主在在线广告平台上优化广告活动的方式之一,本研究通过设计在线自动投标算法来实现广告主在预算和投资回报率限制下的价值最大化,研究还包括竞标优化、价值分布和成交价相关性等方面。
Apr, 2024
本文提出了一种学习策略,通过观察过去的销售数据来设定保留价格,以最小化对收入的后悔,同时本文也探讨了市场噪声分布已知和未知情况下的学习政策和保留价格的设计。
Feb, 2020
该研究采用在线学习的方法,使用无差别反馈模型对 Vickrey 拍卖中的策略进行建模,对随机模型和对抗模型进行研究并设计相应的出价策略,为参与此类拍卖的竞标者提供了第一个完整的策略集。
Nov, 2015