动态激励感知学习：上下文拍卖中的鲁棒性定价

Feb, 2020

动态激励感知学习：上下文拍卖中的鲁棒性定价

Dynamic Incentive-aware Learning: Robust Pricing in Contextual Auctions

Negin Golrezaei, Adel Javanmard, Vahab Mirrokni

TL;DR本文提出了一种学习策略，通过观察过去的销售数据来设定保留价格，以最小化对收入的后悔，同时本文也探讨了市场噪声分布已知和未知情况下的学习政策和保留价格的设计。

Abstract

Motivated by pricing in ad exchange markets, we consider the problem of robust learning of reserve prices against strategic buyers in repeated co

reserve prices contextual second-price auctions robust learning regret minimization strategic behavior

发现论文，激发创造

改进的上下文动态定价算法

在此研究中，我们探讨了上下文动态定价的关键问题，提出了两种估值模型，并针对线性性假设和期望买家估值问题分别设计了算法，以实现较低的后悔率。

Jun, 2024

半参数动态情境定价

基于实时定价与上下文信息，本文提出了一种半参数模型，能够通过回归参数和残差分布来最大化收益，考虑到了细节特征。

Jan, 2019

上下文环境中的二价点击计费竞拍在线学习

研究在线学习在上下文广告竞拍中的应用，通过算法获得最小化收入损失的目标，针对点击率进行估计，提出了两种有效的上下文拍卖算法，并通过实验验证了其有效性和超凡性能。

Oct, 2023

具有战略买家的重复拍卖学习定价

我们研究了在线广告中的买方定价、多次交互和卖方算法，包括买方价值分布推断、策略性遗憾和卖方长期收入最大化。我们定义了策略性遗憾的自然概念，介绍了卖方算法，分析了买方的贴现能力。该文阐述了任何卖方算法在没有贴现时都将遭受线性策略性遗憾。

Nov, 2013

对抗非目光短浅竞拍者的学习最优储备价

本研究针对非近视竞标者在重复拍卖中可能会采取策略性出价以获得未来回合利益的情况下，研究了学习最优保留价格的问题和相关算法。我们提出的算法可以在市场较大（即没有竞标者出现在一组回合的固定比例）或竞标者不耐心的情况下（即他们将未来效用打折，其因子在 1 附近）实现小的后悔率，该方法精细控制每个标注者所可见的信息，并借鉴了差分隐私在线学习和联合差分隐私算法的技术。

Apr, 2018

如何向无悔购买者销售

本文提出了针对单个买方的拍卖问题，探讨了在买方使用 no-regret 学习算法的情况下，卖方进行售价策略和收益最大化的方法。作者通过详细的论证和实验对不同算法和竞标策略下的最优拍卖方式进行了完整的刻画和比较。

Nov, 2017

具有战略买家的情境动态定价

个性化定价策略探讨了与策略性购买者的上下文动态定价问题，并提出了一个战略动态定价策略，该策略能够最大化卖方的累积收入，并能同时估计估值参数和成本参数，从而达到 O (sqrt (T)) 的遗憾上界。

Jul, 2023

无分布偏置的上下文动态定价

本研究旨在探讨基于上下文的动态定价，采用一种新颖的扰动线性 bandit 框架来平衡市场噪音与当前知识的利用，学习上下文函数和市场噪音，证明了所述策略在扰动线性 bandit 框架下的遗憾上界和匹配下界，并且在模拟和现实场景中表现出卓越的性能。

Sep, 2021

背景动态定价中的公平性与需求学习

本文介绍了一种新颖的上下文强化学习算法，用于在具有不确定需求的情况下，根据效用公平性约束进行个性化定价，实现最优的遗憾上限。我们的方法结合动态定价和需求学习，解决了定价策略中的公平性的关键挑战。我们通过数学分析和计算研究来表征受到公平性约束的最优上下文定价策略的结构，并导出了简化的策略，为更深入的研究和扩展打下了基础。此外，我们将研究扩展到具有需求学习的动态定价问题，建立了一个非标准的遗憾下界，突显了公平性约束增加的复杂性。我们的研究提供了公平性成本及其对效用和收入最大化之间平衡的影响的综合分析。本工作是将伦理考虑纳入基于数据驱动的动态定价算法效率的一个步骤。

Nov, 2023

基于学习理论和算法的带保留价的第二价格拍卖收益优化

本研究运用学习算法优化电子市场上二价拍卖的保留价，实现收益最大化。经过理论探讨与实验展示，证明该算法有效性高。

Oct, 2013