Jun, 2024

词典中心的数据收集用于基于 LLM 的机器翻译

TL;DRLexMatcher 方法使用双语词典生成数据集,利用 LLaMA2 作为基础模型并展示出在 WMT2022 测试集上优于已有基线模型的表现,以及在词义消歧和专业术语翻译等任务中显著的性能提升,突出了 LexMatcher 在增强基于 LLM 的机器翻译中的有效性。