Aug, 2023

实现有效的古代中国翻译:数据集,模型和评估

TL;DR我们提出了针对古代汉语的《尔雅》翻译方法,该方法通过从各种来源收集、清理和分类古代汉语材料,形成迄今为止最广泛的古代汉语资源。我们设计了两个同时运作的任务:双音节对齐替代(DAS)和双层掩蔽语言模型(DMLM)。在不同场景下,我们建立了基准来评判古代汉语翻译质量,并评估了各种现有模型的古代汉语翻译能力。我们的模型在五个领域展现了卓越的零 - shot 性能,与 GPT-3.5 模型相比具有 + 12.0 BLEU 的得分,并且在人工评估结果上优于 ERNIE Bot。随后的微调进一步展示了《尔雅》模型的卓越转移能力,获得了 + 6.2 BLEU 的提升。我们在此链接上发布了上述所有资源。