Aug, 2024

从懒惰到丰盛:通过正-无标签序列学习解决开放词汇极端分类中的缺失标签问题

TL;DR本研究针对开放词汇极端多标签分类中因自我选择偏见导致的数据标注缺失问题,提出了正-无标签序列学习(PUSL)方法,将OXMC重新定义为无限关键词生成任务,从而解决生成模型“懒惰”的问题。实验结果表明,PUSL在处理缺失标签的极端分类任务中有效提高了预测质量,提供了可靠的评估指标。