ICMLJun, 2021

学习针对移动目标进行定价

TL;DR本文探讨在 Learning to Price 的环境下,当买家估值是一个移动目标的情况下,寻找一种使卖家能最大化收益的算法,并提供了对于最优收益损失的上下界限制。由于目标一直在移动,所以算法必须在探索和利用之间不断切换来保持最新的信息。