Oct, 2023

印尼金融 NLP 的领域特定语言模型后训练

TL;DR我们在金融领域和印尼语言中进行了一项研究,通过对经过预训练的印尼 BERT 进行金融领域的后训练,并构建了印尼金融文本自监督语料库、印尼金融情感分析数据集和印尼金融主题分类数据集,释放了一系列适用于金融自然语言处理的 BERT 模型。我们还评估了对情感分析和主题分类任务进行领域特定后训练的有效性,发现后训练可以提高语言模型在特定领域下游任务上的效果。