Jan, 2024

IndiText Boost: 低资源印度语言的文本增强

TL;DR本研究主要关注文本增强在印度语言上的应用,使用了多种数据增强技术如 Easy Data Augmentation、Back Translation、Paraphrasing、LLMs 文本生成和 LLMs 文本扩展,并进行了二分类和多分类文本分类实验,结果显示基本的数据增强技术超过了 LLMs。