Sep, 2021

无分布偏置的上下文动态定价

TL;DR本研究旨在探讨基于上下文的动态定价,采用一种新颖的扰动线性 bandit 框架来平衡市场噪音与当前知识的利用,学习上下文函数和市场噪音,证明了所述策略在扰动线性 bandit 框架下的遗憾上界和匹配下界,并且在模拟和现实场景中表现出卓越的性能。