Oct, 2023

Larth: 埃特鲁里亚语数据集和机器翻译

TL;DR提供了一个从古埃特鲁里亚语到英语的机器翻译数据集,其中包含来自现有学术资源的 2891 个翻译示例,并通过对不同机器翻译模型进行了基准测试,发现使用小型 Transformer 模型可以达到 10.1 的 BLEU 分数。发布这个数据集有助于促进对这种语言、类似语言或其他资源匮乏语言的未来研究。