COLINGMar, 2024

跨语言转移还是机器翻译?关于单语义文本相似性的数据增强

TL;DR通过比较两种数据技术(跨语言转移和机器翻译),研究发现,使用英文数据训练的跨语言转移和使用英文数据转换为伪非英文训练数据的机器翻译在日语和韩语的单语 STS 上表现相当。此外,研究还发现 Wikipedia 领域在这些语言上优于 NLI 领域,并结合这些发现实验表明,跨语言转移 Wikipedia 数据能够提高单语 STS 的性能。