ACLMay, 2023

AxomiyaBERTa:一个针对阿萨姆语的音韵感知变换器模型

TL;DR本文提出了一种针对印度东部的形态丰富的低资源语言 (Assamese) 的 BERT 模型,名为 AxomiyaBERTa,该模型只在掩码语言模型 (MLM) 任务上进行训练,不包含典型的下一句预测 (NSP) 目标,结果显示在类似 Assamese 这样的低资源语言的资源稀缺环境中,仅使用 MLM 就可以成功地利用一系列任务,同时 AxomiyaBERTa 在诸如命名实体识别等基于 token 的任务上实现了 SOTA,在 Cloze-style QA 和 Wiki Title Prediction 等基于更长上下文的任务上也表现良好,其背后包含一个新型的嵌入扩散器和音韵信号。此外,本文还表明 AxomiyaBERTa 可以利用音韵信号处理更具挑战性的任务,例如在 ECB+ 语料库的翻译版本中进行新的交叉文件共指任务,我们在 LRL 上呈现了新的 SOTA 结果。