Dec, 2022
自然语言理解中的即时数据增强去噪
On-the-fly Denoising for Data Augmentation in Natural Language Understanding
Tianqing Fang, Wenxuan Zhou, Fangyu Liu, Hongming Zhang, Yangqiu Song...
TL;DR本文介绍了一种基于原始数据集更清洁的假设,利用有机教师模型提供的软增强标签进行学习的数据增强即时去噪方法,并应用简单的自正则化模块来防止在噪声标签上过拟合,该方法可应用于各种数据扩充技术,可以在文本分类和问答任务中提高性能。