神经机器翻译中成语的自动评估和分析

Oct, 2022

神经机器翻译中成语的自动评估和分析

Automatic Evaluation and Analysis of Idioms in Neural Machine Translation

Christos Baziotis, Prashant Mathur, Eva Hasler

TL;DR本文探讨了神经机器翻译中存在的习语翻译难题，提出了一个新的自动化量化习语翻译错误的方法，并通过对模型的训练以及不同翻译测试集的测试，探索了单语预训练和习语上下文因素对翻译质量的影响。

Abstract

A major open problem in neural machine translation (NMT) is the translation of idiomatic expressions, such as "under the weather". The meaning of these expressions is not composed by the meaning of their constitu

neural machine translation idiomatic expressions literal translation errors monolingual pretraining idiom context

发现论文，激发创造

审视冰山一角：一组惯用语翻译的数据集

本文提出了第一个大规模的短语翻译数据集，用于解决神经机器翻译模型中的成语翻译问题，并通过初步的实验评估了该数据集的效果。

Feb, 2018

利用黑名单方法评估中文成语机器翻译性能

本文基于黑名单方法，使用一个新的评估方法 CIBB 测试数据集，对机器翻译系统的成语翻译质量进行了评估，结果表明常见错误类型为逐字逐句字面翻译，黑名单方法可以有效发现该种错误类型。

Nov, 2017

跨越门槛：通过检索增强和损失加权的习语机器翻译

机器翻译的一个挑战是正确翻译习语表达，本研究提供了对习语翻译及相关问题的简单描述，并通过实验找到了适合使用习语翻译的临界点。为了丰富多语种资源，我们编制了一个包含法语、芬兰语和日语中约 4 千个自然句子的数据集，同时引入了两种简单而有效的技术来改进自然习语的翻译，这不仅在习语句子的准确性上提高了强大预训练机器翻译模型达到了 13% 的绝对准确度，而且也对非习语句子存在潜在的好处。

Oct, 2023

翻译意义而非单纯的词语：IdiomKB 在通过语言模型优化成语翻译中的作用

使用大型语言模型开发的多语言习语知识库（IdiomKB）能够提高机器翻译模型的性能，通过检索习语的比喻含义，使较小的模型在翻译过程中得到更全面的理解。

Aug, 2023

HIT 在 SemEval-2022 任务 2 中的表现：预训练语言模型用于成语检测

通过使用预训练的语言模型，我们可以提供上下文感知的句子嵌入来检测句子中的多词表达是否是惯用用法，从而更好地理解多词表达的惯用含义。

Apr, 2022

HilMeMe: 一种基于人机交互的机器翻译准确度度量方法，关注多词表达

本文介绍了一种基于多词表达式的人机协作评估度量方法，旨在评估机器翻译系统中多词表达式的准确性和语义等价性，以此作为评估机器翻译系统的指标。

Nov, 2022

会话系统中成语的向量表征

本文研究表明，由习语或比喻语言训练的开放域对话系统能够更好地生成与包含习语提示相符的回复，通过利用潜在习惯表达（PIE）- 英语习语语料库，我们实现了 98％F1 宏分数的准确率和更好的会话回复效果，为公众贡献了模型检查点 / 演示和代码。

May, 2022

使用语义兼容性进行惯用语表达式识别

本研究提出了一种多阶段深度神经网络架构，利用注意力机制和上下文信息对句子中的习语表达进行定位，通过评估表明该模型能够在各类习语表达的数据集上实现新的最优结果，并具有对未见过的习语表达的识别能力。

Oct, 2021

Transformer 能过于组合吗？分析神经机器翻译中的习语处理

该论文探讨了神经网络机器翻译模型的机制，发现 Transformers 模型在将成语翻译为目标语言时，倾向于将其视为由多个字面意义组成的表达式，导致成语的字面意义被保留。

May, 2022

预训练语言模型中习语的探索数据集和方法

本文介绍了一个包含英语和葡萄牙语的细粒度含义数据集，用于测试语言模型对习语使用的检测能力和生成含有习语句子的表现效果，并且发现 fine-tuning 是学习包含 MWE 的句子表示的一种有效的样本高效方法。

Sep, 2021