AAAINov, 2017

学习用户偏好以促进共享经济中的探索行为

TL;DR通过向用户提供货币奖励来激励他们探索他们可能不会选择的选项是一种有效的方法,使用结构信息模型化为凸约束来学习合适的激励是最佳选择,我们提出了一种新颖的算法 - Coordinated Online Learning(CoOL)用于学习,我们通过测试 Airbnb 上公寓的数据来验证我们的方法是可行的,该方法有助于增加探索。