在此研究中,我们探讨了上下文动态定价的关键问题,提出了两种估值模型,并针对线性性假设和期望买家估值问题分别设计了算法,以实现较低的后悔率。
Jun, 2024
通过可观察的产品特征和顾客特征,提出一种新算法,通过离散化未知噪声分布和上限置信区间与分层数据分区技术的组合,有效地调节每个周期中的懊悔,从而控制与定价决策相关的懊悔,实现极小极大优化。
基于实时定价与上下文信息,本文提出了一种半参数模型,能够通过回归参数和残差分布来最大化收益,考虑到了细节特征。
Jan, 2019
本文提出动态定价模型,以差分隐私保护个人信息并最大化利润,通过引入 anticipanting (ε, δ)- 差分隐私的概念,在个性化信息被对手攻击的情况下,实现了可接受的收益和隐私保护水平,保护了客户的个人信息,实现最大化的收益。
Sep, 2020
本文介绍了一种新颖的上下文强化学习算法,用于在具有不确定需求的情况下,根据效用公平性约束进行个性化定价,实现最优的遗憾上限。我们的方法结合动态定价和需求学习,解决了定价策略中的公平性的关键挑战。我们通过数学分析和计算研究来表征受到公平性约束的最优上下文定价策略的结构,并导出了简化的策略,为更深入的研究和扩展打下了基础。此外,我们将研究扩展到具有需求学习的动态定价问题,建立了一个非标准的遗憾下界,突显了公平性约束增加的复杂性。我们的研究提供了公平性成本及其对效用和收入最大化之间平衡的影响的综合分析。本工作是将伦理考虑纳入基于数据驱动的动态定价算法效率的一个步骤。
Nov, 2023
本研究旨在探讨基于上下文的动态定价,采用一种新颖的扰动线性 bandit 框架来平衡市场噪音与当前知识的利用,学习上下文函数和市场噪音,证明了所述策略在扰动线性 bandit 框架下的遗憾上界和匹配下界,并且在模拟和现实场景中表现出卓越的性能。
Sep, 2021
该研究探讨在线广告和动态定价设计的问题,使用贝叶斯说服模型来研究信号对买家定价和购买决策的影响,提出了一种具有低后悔率的在线算法。
Apr, 2023
本文介绍了使用本地差分隐私的情境赌博算法,为了在保持用户数据隐私不受侵犯的情况下个性化学习,利用了一种基于随机梯度下降法的估计器和更新机制来确保使用 LDP,并且在广义线性情境中利用了该方法。我们还开发了一个基于最小二乘法的评估器和更新机制,最后通过模拟和实际数据集的实验来证明了算法的性能在强隐私保护的条件下具有相当好的表现。
Jun, 2021
研究了一个销售大量产品的公司所面临的定价问题,提出了一种基于稀疏结构的动态策略,称为正则化最大似然定价,其能在 log T 的复杂度下最小化收益损失。
Sep, 2016
本文提出了针对动态定价情况下买家分组的拍卖模型,通过对分布无关和分布相关情况进行分析,得到了买家估价分布的上下界,提出了一种上界近似算法,并给出了其退化情况的解法。
Jul, 2018