ACLMay, 2021
不远不近:通过 MiniMax 实现高样本效率的最近邻数据增强
Not Far Away, Not So Close: Sample Efficient Nearest Neighbour Data Augmentation via MiniMax
Ehsan Kamalloo, Mehdi Rezagholizadeh, Peyman Passban, Ali Ghodsi
TL;DRMinimax-kNN 是一种高效的数据增强策略,基于知识蒸馏的半监督学习方法来训练模型,并且利用 KL-divergence 选择最有效的样本,以实现最大限度地覆盖输入空间中具有最大损失值的区域。该方法在多个文本分类任务中得到了验证,明显优于强基线模型,所需增强样本更少,计算量更小。