Sep, 2021

BARTpho: 为越南语预训练的序列到序列模型

TL;DR本文介绍了两个版本的 BARTpho 模型:BARTpho-syllable 和 BARTpho-word,这两个模型是首个由越南语言训练的公共大规模单语序列到序列模型,使用 BART 的预训练机制,适用于生成式自然语言处理任务。在越南文本摘要等下游任务中,BARTpho 比强基线 mBART 表现更好,进一步在越南大写字母和标点符号恢复任务中表现更为有效。