Jun, 2024

基于贝叶斯激励相容性的双边市场动态在线推荐

TL;DR推荐系统在互联网经济中起着至关重要的作用,本论文提出了一种 Dynamic Bayesian Incentive-Compatible Recommendation Protocol (DBICRP) 来解决有效设计推荐系统所面临的挑战,同时还提出了一种基于两阶段算法 (RCB) 的方法来集成激励探索和高效的离线学习,以达到亚线性遗憾和贝叶斯激励兼容。在理论上,证明了 RCB 算法在高斯先验假设下实现了 O (sqrt (KdT)) 的遗憾和贝叶斯激励兼容,实证上通过模拟和实际应用验证了 RCB 算法的强激励增益、亚线性遗憾和鲁棒性,从而为在线偏好学习中的激励感知推荐提供了一个有原则的方法。