Sep, 2024

在推荐系统中最小化在线实验:用户模拟以评估偏好获取策略

TL;DR本研究解决了在推荐系统中使用实时实验进行政策评估的高成本问题,尤其是在新用户的引导过程中。通过开发反事实鲁棒的用户行为模型和结合生产基础设施的模拟服务,提出了一种新颖的方法来减少在线实验的使用,从而可靠预测新算法的表现。该研究可能显著降低推荐系统评估的成本和时间,提高效率。