WSDMJan, 2022

关于采样协同过滤数据集的研究

TL;DR研究数据集采样策略对推荐算法排名性能的实际影响,设计了一种数据特定的采样策略 SVP-CF,开发了能够建议特定数据集最适宜采样方案的 oracle 工具 Data-Genie,实验结果表明使用 Data-Genie,相对于同级别的采样策略,能丢弃多达 5 倍的数据而保持相同的性能。