Apr, 2023

HQP:用于检测在线宣传的人工注释数据集

TL;DR本研究针对现有在线宣传检测数据集标签噪声大甚至不正确的问题,提出了一个通过人工注释所得的高质量在线宣传检测数据集 HQP,其应用得到的检测效果在 state-of-the-art language models 中有了显著提高。同时,研究探讨了基于高质量标注的 few-shot learning 方法的应用。最终,本研究突显了高质量标注在敏感 NLP 任务中的重要性,为 NLP 社区在权衡标注质量和成本方面提供了启示。