Nov, 2020

Indic-Transformers: 基于 Transformer 模型的印度语言模型分析

TL;DR该研究通过对 Hindi、Bengali 和 Telugu 语言进行广泛实验,评估了基于 Transformer 架构的语言模型在印度语言上的性能,发现 Fine-tuning 预训练模型参数比从头训练语言模型更有效,而数据集大小与模型性能之间的严格依赖关系需要被探讨。最终,在文本分类任务中实现了 Hindi 和 Bengali 语言的最新技术水平,并提出了处理印度语言建模问题的有效策略。