Feb, 2022
JParaCrawl v3.0:大规模英日平行语料库
JParaCrawl v3.0: A Large-scale English-Japanese Parallel Corpus
Makoto Morishita, Katsuki Chousa, Jun Suzuki, Masaaki Nagata
TL;DR本文介绍了一个新的基于网络的英日平行语料库 JParaCrawl v3.0,其包括超过 2100 万个独特的平行句对,证明它可以提高各种领域机器翻译模型的准确性,并将在将来公开发布。