SIGIRJun, 2023

通过检索增强的多阶段训练实现弱监督科学文档分类

TL;DR本研究提出了一种弱监督方法 (WANDER) 用于科学文献分类,使用标签名称作为唯一标注,利用稠密检索匹配方式捕捉标签名称的语义,并设计标签名称扩展模块来丰富标签名称的表示,最后使用自我训练步骤来细化预测,该方法在三个数据集上的表现优于最佳基准线约 11.9%。