Aug, 2018

大型训练数据集下的古今中文翻译

TL;DR本文提出了一种基于古汉语和现代汉语特点的 Ancient-Modern Chinese 从句对齐方法,综合了基于词汇和统计信息的两种方法,用于创建了一个包含 124 万个双语对的大规模语料库,并分析了在此数据集上各种机器翻译模型的性能,并为该任务提供了强大的基准。