Oct, 2017

孟买印度理工学院英汉平行语料库

TL;DR本文介绍了 IIT Bombay 英印双语平行语料库,包含超过 140 万个平行句段,其中有 69.4k 个句段从未公开发布,是目前公开发布的最大的英印平行语料库之一,并已被用于机器翻译的基准测试和分享任务。此语料库可供非商业研究免费使用。