背景动态定价中的公平性与需求学习

Nov, 2023

背景动态定价中的公平性与需求学习

Utility Fairness in Contextual Dynamic Pricing with Demand Learning

Xi Chen, David Simchi-Levi, Yining Wang

TL;DR本文介绍了一种新颖的上下文强化学习算法，用于在具有不确定需求的情况下，根据效用公平性约束进行个性化定价，实现最优的遗憾上限。我们的方法结合动态定价和需求学习，解决了定价策略中的公平性的关键挑战。我们通过数学分析和计算研究来表征受到公平性约束的最优上下文定价策略的结构，并导出了简化的策略，为更深入的研究和扩展打下了基础。此外，我们将研究扩展到具有需求学习的动态定价问题，建立了一个非标准的遗憾下界，突显了公平性约束增加的复杂性。我们的研究提供了公平性成本及其对效用和收入最大化之间平衡的影响的综合分析。本工作是将伦理考虑纳入基于数据驱动的动态定价算法效率的一个步骤。

Abstract

This paper introduces a novel contextual bandit algorithm for personalized pricing under utility fairness constraints in scenarios with uncertain demand, achieving an optimal regret upper bound. Our approach, whi

contextual bandit algorithm personalized pricing utility fairness constraints dynamic pricing demand learning

发现论文，激发创造

上下文动态定价：算法、优化和局部差分隐私约束

研究了上下文动态定价问题，探讨了需求模型、遗憾上限的最优化和隐私保护对动态定价的影响。

Jun, 2024

无分布偏置的上下文动态定价

本研究旨在探讨基于上下文的动态定价，采用一种新颖的扰动线性 bandit 框架来平衡市场噪音与当前知识的利用，学习上下文函数和市场噪音，证明了所述策略在扰动线性 bandit 框架下的遗憾上界和匹配下界，并且在模拟和现实场景中表现出卓越的性能。

Sep, 2021

改进的上下文动态定价算法

在此研究中，我们探讨了上下文动态定价的关键问题，提出了两种估值模型，并针对线性性假设和期望买家估值问题分别设计了算法，以实现较低的后悔率。

Jun, 2024

学习中的公平性：经典和情境赌博机

本研究介绍了多臂赌博问题中的公平性概念以及提出了基于 “chained” 置信区间的多臂赌博问题的可证公平算法，并证明了任何公平算法必须具有该算法的时间复杂度，同时也证明了公平和非公平学习之间有强烈的界限。在一般情境中，本研究证明了公平性与 KWIK 学习模型的紧密联系，并提出了一种多项式时间复杂度的可证公平算法来解决线性上下文赌博问题。

May, 2016

半参数动态情境定价

基于实时定价与上下文信息，本文提出了一种半参数模型，能够通过回归参数和残差分布来最大化收益，考虑到了细节特征。

Jan, 2019

上下文动态定价与综合估值模型中的极小化最优性

通过可观察的产品特征和顾客特征，提出一种新算法，通过离散化未知噪声分布和上限置信区间与分层数据分区技术的组合，有效地调节每个周期中的懊悔，从而控制与定价决策相关的懊悔，实现极小极大优化。

Jun, 2024

$α$- 公平上下文强化学习

设计了一种高效算法，确保在全信息和强盗反馈设置中几乎达到次线性的遗憾，以解决 alpha-fair contextual bandits 问题。

Oct, 2023

资源丰富的情境臂控制器

我们设计了第一个算法来解决具有资源限制的情境赌博问题，包括具有任意策略集的情境赌博和背包式赌博，并证明了具有接近最优统计属性的遗憾保证。

Feb, 2014

对不公平动态定价的公正激励

利用动态定价和人工智能方法来解决需求公平和税收再分配政策的问题，并通过模拟经济的实验验证了这种介入策略的潜在效果。

Apr, 2024

动态激励感知学习：上下文拍卖中的鲁棒性定价

本文提出了一种学习策略，通过观察过去的销售数据来设定保留价格，以最小化对收入的后悔，同时本文也探讨了市场噪声分布已知和未知情况下的学习政策和保留价格的设计。

Feb, 2020