重复拍卖中的在线学习
在复杂拍卖场景中,我们提出了一种在线学习方法,通过利用投标方的效用结构和部分反馈,为拍卖算法提供对最佳固定竞标的遗憾率,这对于行动空间的依赖程度来说比应用通用的贝叶斯智能带宽算法要快指数级收敛,同时又几乎等同于在完全信息环境下所实现的收敛,这些结果是通过分析这一新的基于反馈的在线学习方法实现的。
Nov, 2017
该论文研究了在重复多单位拍卖中基于均匀定价的两个变体,并分析了在线和离线设置下的问题。作者提出了离线最优策略算法,并设计了高效的在线算法,同时通过博弈理论探究了平衡的质量。
May, 2023
我们研究了在线广告中的买方定价、多次交互和卖方算法,包括买方价值分布推断、策略性遗憾和卖方长期收入最大化。我们定义了策略性遗憾的自然概念,介绍了卖方算法,分析了买方的贴现能力。该文阐述了任何卖方算法在没有贴现时都将遭受线性策略性遗憾。
Nov, 2013
本文研究了对手环境下的在线学习算法的设计,提出了广义随机扰动跟随者算法,且证明了在一定条件下它是牛逼优而且可以实现消失的后悔;同时,本文也提出了另一个基于拍卖设计的框架,用于帮助拍卖师在选举获得最佳的拍卖方式方面做出决策,并且得到相应的应用。
Nov, 2016
本研究探讨了如何学习在首价拍卖中进行出价,针对这一问题开发了首个达到最小化一般策略集的竞标算法,能够显著提升现有竞标算法的效果。这一算法利用专家策略和层级策略,取得了不错的效果,在三个真实场景的测试中表现出了优越性。
Jul, 2020
自动投标算法是广告主在在线广告平台上优化广告活动的方式之一,本研究通过设计在线自动投标算法来实现广告主在预算和投资回报率限制下的价值最大化,研究还包括竞标优化、价值分布和成交价相关性等方面。
Apr, 2024
我们研究了重复的一阶售价拍卖和一般重复贝叶斯博弈的情况,在这种情况下,一个参与者(学习者)采用了一个无悔学习算法,而另一个参与者(优化者)在了解学习者的算法的情况下,策略化地追求自己的效用最大化。 对于一类被称为基于均值的无悔学习算法,我们证明:(i)在标准(即完全信息)的一阶售价拍卖中,优化者不能获得超过 Stackelberg 效用的效用 -- 这是文献中的标准基准,但是(ii)在贝叶斯一阶售价拍卖中,存在优化者可以获得远高于 Stackelberg 效用的实例。 另一方面,Mansour 等人(2022)证明了一类更复杂的算法,称为无多面体交换后悔算法可以将优化者的效用限制在任意重复贝叶斯博弈(包括贝叶斯一阶售价拍卖)的 Stackelberg 效用上,并提出是否有必要使用无多面体交换后悔算法来限制优化者的效用。对于一般的贝叶斯博弈,在一个合理且必要的条件下,我们证明了无多面体交换后悔算法确实是将优化者的效用限制在 Stackelberg 效用上的必要条件,从而回答了他们的开放性问题。对于贝叶斯一阶售价拍卖,我们通过利用贝叶斯一阶售价拍卖的结构给出了一个简单的改进标准算法来最小化多面体交换后悔。
Feb, 2024
学习在重复的一价拍卖中进行投标是博弈论和机器学习之间的一个基本问题,我们提出了一种新颖的凸形式用于分析一价拍卖中的纯策略投标,并证明了我们的算法可以有效鼓励拍卖买家真实报价并且无法被巧言利用。
Feb, 2024
针对在线拍卖 / 定价问题的收益最大化问题,我们通过将专家学习和多臂赌博机问题推广到多尺度版本来推导出可缩放最佳固定价格而非价值范围的遗憾界,并且当与需要市场份额下限的基准进行比较时,可以获得几乎无尺度的遗憾界,同时满足离线样本复杂性。
May, 2017