不知道自己价值的情况下学习投标

Nov, 2017

不知道自己价值的情况下学习投标

Learning to Bid Without Knowing your Value

Zhe Feng, Chara Podimata, Vasilis Syrgkanis

TL;DR在复杂拍卖场景中，我们提出了一种在线学习方法，通过利用投标方的效用结构和部分反馈，为拍卖算法提供对最佳固定竞标的遗憾率，这对于行动空间的依赖程度来说比应用通用的贝叶斯智能带宽算法要快指数级收敛，同时又几乎等同于在完全信息环境下所实现的收敛，这些结果是通过分析这一新的基于反馈的在线学习方法实现的。

Abstract

We address online learning in complex auction settings, such as sponsored search auctions, where the value of the bidder is unknown to her, evolving in an arbitrary manner and observed only if the bidder wins an

online learning auctions utility regret feedback

发现论文，激发创造

重复拍卖中的在线学习

该研究采用在线学习的方法，使用无差别反馈模型对 Vickrey 拍卖中的策略进行建模，对随机模型和对抗模型进行研究并设计相应的出价策略，为参与此类拍卖的竞标者提供了第一个完整的策略集。

Nov, 2015

多单位拍卖中的在线学习

该论文研究了在重复多单位拍卖中基于均匀定价的两个变体，并分析了在线和离线设置下的问题。作者提出了离线最优策略算法，并设计了高效的在线算法，同时通过博弈理论探究了平衡的质量。

May, 2023

重复多单位按竞标付费拍卖中的学习

通过离线动态规划方案，设计了在线学习算法以解决多次多单位逐标付款拍卖中的出价问题，并获得关于遗憾上界的结果，研究表明这种拍卖方式产生更高的收入。

Jul, 2023

具有预算和 ROI 约束的非真实拍卖的无悔算法

自动投标算法是广告主在在线广告平台上优化广告活动的方式之一，本研究通过设计在线自动投标算法来实现广告主在预算和投资回报率限制下的价值最大化，研究还包括竞标优化、价值分布和成交价相关性等方面。

Apr, 2024

高效在线学习和拍卖设计

本文研究了对手环境下的在线学习算法的设计，提出了广义随机扰动跟随者算法，且证明了在一定条件下它是牛逼优而且可以实现消失的后悔；同时，本文也提出了另一个基于拍卖设计的框架，用于帮助拍卖师在选举获得最佳的拍卖方式方面做出决策，并且得到相应的应用。

Nov, 2016

在线多尺度学习及其在网络拍卖中的应用

针对在线拍卖 / 定价问题的收益最大化问题，我们通过将专家学习和多臂赌博机问题推广到多尺度版本来推导出可缩放最佳固定价格而非价值范围的遗憾界，并且当与需要市场份额下限的基准进行比较时，可以获得几乎无尺度的遗憾界，同时满足离线样本复杂性。

May, 2017

在对抗性一价拍卖中学习最优且高效的竞标策略

本研究探讨了如何学习在首价拍卖中进行出价，针对这一问题开发了首个达到最小化一般策略集的竞标算法，能够显著提升现有竞标算法的效果。这一算法利用专家策略和层级策略，取得了不错的效果，在三个真实场景的测试中表现出了优越性。

Jul, 2020

应用于一价拍卖中出价的战略稳健学习算法

学习在重复的一价拍卖中进行投标是博弈论和机器学习之间的一个基本问题，我们提出了一种新颖的凸形式用于分析一价拍卖中的纯策略投标，并证明了我们的算法可以有效鼓励拍卖买家真实报价并且无法被巧言利用。

Feb, 2024

对抗非目光短浅竞拍者的学习最优储备价

本研究针对非近视竞标者在重复拍卖中可能会采取策略性出价以获得未来回合利益的情况下，研究了学习最优保留价格的问题和相关算法。我们提出的算法可以在市场较大（即没有竞标者出现在一组回合的固定比例）或竞标者不耐心的情况下（即他们将未来效用打折，其因子在 1 附近）实现小的后悔率，该方法精细控制每个标注者所可见的信息，并借鉴了差分隐私在线学习和联合差分隐私算法的技术。

Apr, 2018

具有图结构反馈的非随机多臂赌博机

本文研究了一种名为 “部分信息” 的在线学习模型，提出了多种算法，通过信息反馈结构的组合特性，给出了紧密的遗憾界限。

Sep, 2014