ACLMay, 2021

不远不近:通过 MiniMax 实现高样本效率的最近邻数据增强

TL;DRMinimax-kNN 是一种高效的数据增强策略,基于知识蒸馏的半监督学习方法来训练模型,并且利用 KL-divergence 选择最有效的样本,以实现最大限度地覆盖输入空间中具有最大损失值的区域。该方法在多个文本分类任务中得到了验证,明显优于强基线模型,所需增强样本更少,计算量更小。