Jun, 2022
全局混合:通过聚类消除歧义
Global Mixup: Eliminating Ambiguity with Clustering
Xiangjin Xie, Yangning Li, Wang Chen, Kai Ouyang, Li Jiang...
TL;DR提出基于全局聚类关系的新型数据扩增方法 ——Global Mixup,其中通过将先前的一阶段扩增过程分解为两阶段,从而将生成虚拟样本的过程与标记过程分离,并根据生成样本的全局关系计算子集对生成样本的标签重新标记,从而在更大的采样空间中生成更可靠的虚拟样本。在 CNN、LSTM 和 BERT 上的五项任务的广泛实验表明,Global Mixup 明显优于现有最新技术基线。