WWWNov, 2018

半监督信息检索的对抗采样和训练

TL;DR本文提出一种针对 ad-hoc 检索模型的数据不平衡及神经网络模型易受对抗干扰等问题的对抗性采样和训练框架,通过增强点击示例和获得非常信息化的非点击示例来学习 ad-hoc 检索模型,并在常见 ad-hoc 检索任务(如网络搜索,项目推荐和问答)的基准数据集上进行实验,结果表明该方法在高排名文档方面显着优于强基线,并且在使用仅占 5%的已标记数据对 IRGAN 在 NDCG@5 上实现更好的表现。