Nov, 2022

百万级跨语言条款级联结构转换器

TL;DR本文介绍了我们在 MRL 2022 胜出的系统,主要探索了基于 transformers 的两种方法:从头训练模型结合数据增强以及在多语言词形态任务中进行前缀调校的迁移学习,其中数据增强显著提高了大多数语言的词形和重构任务的性能,而前缀调校在预先训练的 mGPT 模型上对低数据量和多语言环境中的分析任务进行了适应,结果显示 transformers 与数据增强在词形和重构任务方面取得了最佳结果,而在分析任务方面,基于 mGPT 的前缀调校取得了最高结果。