未知参数需求模型下的 Markdown 定价
本文提出了针对动态定价情况下买家分组的拍卖模型,通过对分布无关和分布相关情况进行分析,得到了买家估价分布的上下界,提出了一种上界近似算法,并给出了其退化情况的解法。
Jul, 2018
我们研究了需求函数为非参数化和 H"older 平滑的动态定价问题,重点关注对需求函数的未知 H"older 平滑参数 β 的可适应性。在没有 β 的知识的情况下,我们证明了没有定价策略能够达到这个极小化后悔的最佳性能。受到这个不可能结果的启发,我们提出了一个自相似条件来实现可适应性。我们开发了一种平滑自适应动态定价算法,并在理论上证明该算法实现了这个最佳性能的后悔边界,而无需先验知识 β。
Oct, 2023
通过可观察的产品特征和顾客特征,提出一种新算法,通过离散化未知噪声分布和上限置信区间与分层数据分区技术的组合,有效地调节每个周期中的懊悔,从而控制与定价决策相关的懊悔,实现极小极大优化。
Jun, 2024
研究线性随机赌博机的噪声模型,介绍一种基于加权最小二乘估计的算法,能够最小化后悔度,通过几何论证独立于噪声模型,能够紧密控制每个时间步骤的期望后悔度为 O (1/t),从而导致了累积后悔度的对数缩放。
Feb, 2024
该研究提出了在线线性优化问题的带有 bandit 反馈的算法,并使用 Mirror Descent 算法在特定案例中获得具有最小二乘优化后退限制的计算高效性的策略,证明了计算上以及最小二乘上的结果优化,为输出结果减少了冗余的符号。
Feb, 2012
本文研究了在损失函数任意的情况下,对于线性近似的 Q 函数,提出了两种算法,可以在拥有模拟器的情况下使得损失最小值达到 $\tilde {\mathcal O}(\sqrt K)$,并在无模拟器情况下实现了 $ ilde {\mathcal O}(K^{8/9})$ 的表现,改进了之前的表现
Jan, 2023
研究了有限动作集的线性上下文强化学习问题,介绍了一种名为 VCL SupLinUCB 的算法,并表明其与最佳下界相匹配,相较于之前的算法分析,节省了两个对数因子。
Mar, 2019