May, 2023

IndicTrans2:适用于所有 22 个印度预定语言的高质量可访问机器翻译模型

TL;DR该研究旨在通过整合并创建特定于印度的并行语料库和基准测试数据,训练出支持所有 22 种印度语言的机器翻译模型,为印度的语言多样性提供广泛且易于访问的机器翻译系统,该研究创造性地提出了四个关键领域的改进,并发布了 BPCC 和 IndicTrans2 等数据资源和模型。