May, 2022

在检索相关文档的分析上,解决不平衡分类问题的方法比较

TL;DR研究比较了基于关键词列表、查询扩展技术、基于主题模型的分类规则以及主动有监督学习四种不同的检索方法,结果表明:基于关键词列表的检索方法容易出现偏见,而主动有监督学习方法在使用合适数量的已标记训练实例时,能够显著提高检索效果。