May, 2024

TransMI: 创建多语言预训练语言模型的强基线框架,用于音译数据

TL;DR该论文提出了一个简单而有效的框架 TransMI,通过利用多语言预训练语言模型(mPLMs)及其伴随的标记器,将数据转写成共同脚本,从而创建一个强大的基准,有效处理转写数据,提高 3% 至 34% 的性能。