Jan, 2024

从随机到有知识的数据选择:基于多样性的方法优化人工标注和少样本学习

TL;DR在自然语言处理中,获取用于监督学习的带注释数据是一个重要挑战。本文提出了一种自动和明智的数据选择架构,用于建立用于少样本学习的小型数据集,以解决众包标注的问题。