Apr, 2021

使用门控循环单元和汤普森抽样的动态石板推荐

TL;DR通过建立一种基于变分贝叶斯递归神经网络的推荐系统,利用用户和网络交互的时间序列数据,自适应地为用户提供适宜的内容,同时引入一种层级先验以及组内成员关系考虑的项参数学习方法,结合多臂老虎机策略以及 slate Thompson Sampling 算法优化推荐效果,并在在线实验和来自挪威 FINN.no 平台的离线数据测试中验证了该方法的有效性。