通过离线动态规划方案,设计了在线学习算法以解决多次多单位逐标付款拍卖中的出价问题,并获得关于遗憾上界的结果,研究表明这种拍卖方式产生更高的收入。
Jul, 2023
针对在线拍卖 / 定价问题的收益最大化问题,我们通过将专家学习和多臂赌博机问题推广到多尺度版本来推导出可缩放最佳固定价格而非价值范围的遗憾界,并且当与需要市场份额下限的基准进行比较时,可以获得几乎无尺度的遗憾界,同时满足离线样本复杂性。
May, 2017
该研究采用在线学习的方法,使用无差别反馈模型对 Vickrey 拍卖中的策略进行建模,对随机模型和对抗模型进行研究并设计相应的出价策略,为参与此类拍卖的竞标者提供了第一个完整的策略集。
Nov, 2015
在复杂拍卖场景中,我们提出了一种在线学习方法,通过利用投标方的效用结构和部分反馈,为拍卖算法提供对最佳固定竞标的遗憾率,这对于行动空间的依赖程度来说比应用通用的贝叶斯智能带宽算法要快指数级收敛,同时又几乎等同于在完全信息环境下所实现的收敛,这些结果是通过分析这一新的基于反馈的在线学习方法实现的。
Nov, 2017
本研究探讨了如何学习在首价拍卖中进行出价,针对这一问题开发了首个达到最小化一般策略集的竞标算法,能够显著提升现有竞标算法的效果。这一算法利用专家策略和层级策略,取得了不错的效果,在三个真实场景的测试中表现出了优越性。
Jul, 2020
本文首次研究了非平稳环境下的在线二价拍卖问题,提出一种算法并取得了接近最优的非平稳后悔度。
Nov, 2019
本文研究了对手环境下的在线学习算法的设计,提出了广义随机扰动跟随者算法,且证明了在一定条件下它是牛逼优而且可以实现消失的后悔;同时,本文也提出了另一个基于拍卖设计的框架,用于帮助拍卖师在选举获得最佳的拍卖方式方面做出决策,并且得到相应的应用。
Nov, 2016
本文研究了协同在线竞标算法在具有预算限制的重复次数第二价格拍卖中的效率,提出保证每个客户比独立竞标获得更高效用价值的算法,并以在线学习和均衡分析为技术支持,实现与多维基准的竞争。
Jun, 2023
学习在重复的一价拍卖中进行投标是博弈论和机器学习之间的一个基本问题,我们提出了一种新颖的凸形式用于分析一价拍卖中的纯策略投标,并证明了我们的算法可以有效鼓励拍卖买家真实报价并且无法被巧言利用。
Feb, 2024
本文提出了针对单个买方的拍卖问题,探讨了在买方使用 no-regret 学习算法的情况下,卖方进行售价策略和收益最大化的方法。作者通过详细的论证和实验对不同算法和竞标策略下的最优拍卖方式进行了完整的刻画和比较。