学习同质数据定价
本文提出了针对动态定价情况下买家分组的拍卖模型,通过对分布无关和分布相关情况进行分析,得到了买家估价分布的上下界,提出了一种上界近似算法,并给出了其退化情况的解法。
Jul, 2018
本研究探讨了如何学习在首价拍卖中进行出价,针对这一问题开发了首个达到最小化一般策略集的竞标算法,能够显著提升现有竞标算法的效果。这一算法利用专家策略和层级策略,取得了不错的效果,在三个真实场景的测试中表现出了优越性。
Jul, 2020
本文探讨在Learning to Price的环境下,当买家估值是一个移动目标的情况下,寻找一种使卖家能最大化收益的算法,并提供了对于最优收益损失的上下界限制。由于目标一直在移动,所以算法必须在探索和利用之间不断切换来保持最新的信息。
Jun, 2021
个性化定价策略探讨了与策略性购买者的上下文动态定价问题, 并提出了一个战略动态定价策略,该策略能够最大化卖方的累积收入,并能同时估计估值参数和成本参数,从而达到O(sqrt(T))的遗憾上界。
Jul, 2023
在基于赌博学习模型中,研究了顺序发布定价和后悔边界,得到了针对不同分布情况下的几乎最优后悔边界,尤其是对于正常分布的情况,基于收益函数在价值空间中的新型半凹特性,实现了新的结果。
Dec, 2023
在这篇研究论文中,我们研究了动态定价问题,其中客户对当前价格的反应受到客户的价格期望(参考价格)的影响。我们研究了一种简单而新颖的参考价格机制,其中参考价格是卖方过去所提供的价格的平均值。我们证明,在这种机制下,降价政策是近乎最优的,无论模型的参数如何。此外,我们提供了线性需求模型下近乎最优降价政策的详细特征描述,并提供了一种高效的计算方法。然后,我们考虑了一种更具挑战性的动态定价和学习问题,其中需求模型参数是先验未知的,卖方需要从客户对所提供价格的反应中在线学习这些参数,并同时优化收入。我们的目标是最小化遗憾,即与卓越最优政策相比,T轮收入损失。对于线性需求模型,我们提供了一个高效的学习算法,并得到了一个最优的Ο(√T)遗憾上界。
Feb, 2024
我们研究了在经纪人之间的在线学习问题中上下文信息的作用。我们假设交易资产的市场价值是代表经纪人可用的上下文信息的$d$维向量的未知线性函数。我们通过与交易利润相关的遗憾来评估学习算法的性能,并提供了相应的遗憾界限。
May, 2024