Oct, 2023

提高印度人民的司法准入:评估法律文本翻译成印度语言的基准

TL;DR印度司法体系的大部分法律文本由于历史原因以复杂的英语编写而成,然而只有约 10% 的印度人能够阅读英语,因此需要将法律文本转化成各种印度语言,考虑到可用的英文法律文本的翻译。虽然对于印度语言之间的翻译已经有了很多研究,但据我们所知,在法律领域中对于这种翻译的先前工作并不多。在本研究中,我们构建了第一个高质量的法律平行语料库,其中包含了英语和九种印度语言的对齐文本单元,包括一些资源稀缺的语言。我们还对该语料库上的各种机器翻译系统进行了性能评估,其中包括商业机器翻译系统、开源机器翻译系统和大型语言模型。通过对法律从业人员的全面调查,我们了解了他们对其中一些机器翻译系统的满意度,并比较了自动机器翻译评估指标与法律从业人员意见之间的一致性。