KDDJul, 2021
多源噪声模拟与难例挖掘用于文本分类的鲁棒性学习
Robust Learning for Text Classification with Multi-source Noise Simulation and Hard Example Mining
Guowei Xu, Wenbiao Ding, Weiping Fu, Zhongqin Wu, Zitao Liu
TL;DR本研究提出了一种新的训练框架,通过直接模拟自然 OCR 噪声并从大量的模拟样本中迭代挖掘难样本来提高模型性能,实验表明该框架大大提高了预训练模型的鲁棒性,可以在实际场景下极大地促进 NLP 模型的应用。