EMNLPOct, 2021

基于多语言 Transformer 的序列 - 序列词汇规范化

TL;DR本论文通过使用基于 mBART 的句子级序列到序列模型,将自然语言处理中的标准化问题归结为机器翻译问题,利用多语言预训练技术进行 fine-tuned,优于操作原始社交媒体文本的模型,在下游任务中实现性能提升。