Jun, 2020

无问题的调查:一种强化学习方法

TL;DR通过使用基于强化学习(RL)的方法从clickstream数据中提取代理评分(proxy ratings),无需使用调查数据进行训练。代理评分比传统的调查数据更加直观和有用,可以有效地解决调查数据存在的各种缺陷。