Oct, 2017
孟买印度理工学院英汉平行语料库
The IIT Bombay English-Hindi Parallel Corpus
Anoop Kunchukuttan, Pratik Mehta, Pushpak Bhattacharyya
TL;DR本文介绍了 IIT Bombay 英印双语平行语料库,包含超过 140 万个平行句段,其中有 69.4k 个句段从未公开发布,是目前公开发布的最大的英印平行语料库之一,并已被用于机器翻译的基准测试和分享任务。此语料库可供非商业研究免费使用。