Apr, 2024

FRACTAL:基于文本标签的细粒度评分

TL;DR我们介绍了一种将响应级别标签细分为句子级别(伪)标签的方法,该方法利用多实例学习(MIL)和学习标签比例(LLP)技术以及先前信息训练专用模型进行句子级别评分,并利用模型预测对训练集进行伪标签,以进一步提高性能。我们在六个数据集和四个任务上进行了广泛的评估,结果表明在大多数任务中与多个基准方法相比,我们的方法性能有所提高。这项工作是第一个将响应级别反馈应用到句子级别评分技术,并利用句子级别先前信息进行全面评估的工作,同时进行了端到端微调评估,表明性能与基于精细人工标注标签训练的模型相当。