未知参数需求模型下的 Markdown 定价

Dec, 2023

未知参数需求模型下的 Markdown 定价

Markdown Pricing Under an Unknown Parametric Demand Model

Su Jia, Andrew Li, R. Ravi

TL;DR在这项研究中，我们提供关于收入最大化问题的完整解决方案，引入交叉数量来衡量需求函数族的复杂性，并基于不确定性下的保守性，针对不同的交叉数量提出了衡量函数。

Abstract

Consider a single-product revenue-maximization problem where the seller monotonically decreases the price in $n$ rounds with an unknown demand model coming from a given family. Without →

revenue-maximization problem demand model minimax regret monotonicity parametric demand models

发现论文，激发创造

有限未知估值的动态定价

本文提出了针对动态定价情况下买家分组的拍卖模型，通过对分布无关和分布相关情况进行分析，得到了买家估价分布的上下界，提出了一种上界近似算法，并给出了其退化情况的解法。

Jul, 2018

平滑自适应非参数需求学习的动态定价

我们研究了需求函数为非参数化和 H"older 平滑的动态定价问题，重点关注对需求函数的未知 H"older 平滑参数 β 的可适应性。在没有 β 的知识的情况下，我们证明了没有定价策略能够达到这个极小化后悔的最佳性能。受到这个不可能结果的启发，我们提出了一个自相似条件来实现可适应性。我们开发了一种平滑自适应动态定价算法，并在理论上证明该算法实现了这个最佳性能的后悔边界，而无需先验知识 β。

Oct, 2023

上下文动态定价与综合估值模型中的极小化最优性

通过可观察的产品特征和顾客特征，提出一种新算法，通过离散化未知噪声分布和上限置信区间与分层数据分区技术的组合，有效地调节每个周期中的懊悔，从而控制与定价决策相关的懊悔，实现极小极大优化。

Jun, 2024

高维下的动态定价

研究了一个销售大量产品的公司所面临的定价问题，提出了一种基于稀疏结构的动态策略，称为正则化最大似然定价，其能在 log T 的复杂度下最小化收益损失。

Sep, 2016

多对数级别的极小极大遗憾的线性赌博机

研究线性随机赌博机的噪声模型，介绍一种基于加权最小二乘估计的算法，能够最小化后悔度，通过几何论证独立于噪声模型，能够紧密控制每个时间步骤的期望后悔度为 O (1/t)，从而导致了累积后悔度的对数缩放。

Feb, 2024

在线线性优化带赌博式反馈的极小极大政策

该研究提出了在线线性优化问题的带有 bandit 反馈的算法，并使用 Mirror Descent 算法在特定案例中获得具有最小二乘优化后退限制的计算高效性的策略，证明了计算上以及最小二乘上的结果优化，为输出结果减少了冗余的符号。

Feb, 2012

线性函数逼近的对抗式 MDP 的精炼遗憾

本文研究了在损失函数任意的情况下，对于线性近似的 Q 函数，提出了两种算法，可以在拥有模拟器的情况下使得损失最小值达到 $\tilde {\mathcal O}(\sqrt K)$，并在无模拟器情况下实现了 $ ilde {\mathcal O}(K^{8/9})$ 的表现，改进了之前的表现

Jan, 2023

上下文动态定价：算法、优化和局部差分隐私约束

研究了上下文动态定价问题，探讨了需求模型、遗憾上限的最优化和隐私保护对动态定价的影响。

Jun, 2024

线性参数赌博机的近似极小极大后悔

研究了有限动作集的线性上下文强化学习问题，介绍了一种名为 VCL SupLinUCB 的算法，并表明其与最佳下界相匹配，相较于之前的算法分析，节省了两个对数因子。

Mar, 2019

带有赌徒反馈的最小化最大化子模优化

利用随机 bandit 反馈在无序集合函数最大化问题中建立了首个极小极大下界，并提出了一个能够匹配下界的算法。

Oct, 2023