Mar, 2019

利用 ULMFit 和回译进行低资源文本分类

TL;DR通过深度学习模型数据增强技术,本文提高了 IMDB 电影评论数据集的文本分类准确性,其中采用了 Wei 和 Zou(2019)介绍的随机 token 扰动和将其翻译回到英语的回译技术,而回译技术的效果优于其他技术。最终,通过使用回译技术进行测试时间增强并将 ULMFit 模型与其他模型组合,实现了小幅度的性能提升。