Feb, 2020

动态激励感知学习:上下文拍卖中的鲁棒性定价

TL;DR本文提出了一种学习策略,通过观察过去的销售数据来设定保留价格,以最小化对收入的后悔,同时本文也探讨了市场噪声分布已知和未知情况下的学习政策和保留价格的设计。