Aug, 2022

CJaFr-v3: 一个免费可获取的经过过滤的日法对齐语料库

TL;DR本文介绍了一个包含 1500 万对日文 - 法文句子的平行语料库,展示了资源的数量和质量,以及他们进行过的过滤方式和评估结果。通过该语料库训练和评估了一些标准的 MT 系统,证明了其实用性和过滤质量的有效性。