May, 2024
TransMI: 创建多语言预训练语言模型的强基线框架,用于音译数据
TransMI: A Framework to Create Strong Baselines from Multilingual Pretrained Language Models for Transliterated Data
Yihong Liu, Chunlan Ma, Haotian Ye, Hinrich Schütze
TL;DR该论文提出了一个简单而有效的框架 TransMI,通过利用多语言预训练语言模型(mPLMs)及其伴随的标记器,将数据转写成共同脚本,从而创建一个强大的基准,有效处理转写数据,提高 3% 至 34% 的性能。