基于词向量的词对齐段级机器翻译评估

Apr, 2017

基于词向量的词对齐段级机器翻译评估

Word-Alignment-Based Segment-Level Machine Translation Evaluation using Word Embeddings

Junki Matsuo, Mamoru Komachi, Katsuhito Sudoh

TL;DR利用词嵌入进行机器翻译的段落级别评估，三种对齐方法的实验结果显示我们的方法优于以往使用词嵌入的方法。

Abstract

One of the most important problems in machine translation (MT) evaluation is to evaluate the similarity between translation hypotheses with different surface forms from the reference, especially at the segment level. We propose to use →

machine translation mt evaluation word alignment word embeddings experimental results

发现论文，激发创造

利用神经机器翻译嵌入词汇相似度

该研究探讨神经机器翻译模型所学到的嵌入，在需要同时考虑概念相似性和词汇 - 句法角色知识的任务中，它们的性能优于单语言模型所学到的嵌入。研究结果还表明，词汇扩展算法对嵌入质量的影响很小。

Dec, 2014

神经网络进行机器翻译评估

使用神经网络在配对设置下进行机器翻译评估的框架，以从一对假设中选择更好的翻译为目标。该框架将参考和两个假设的词汇、句法和语义信息嵌入到紧凑的分布式向量表示中，并提供了一个与人类判断相关的 MT 评估度量。

Oct, 2017

以词和句相似性重新思考评估

本文提出了 EvalRank 作为一种新的内部评估方法，它在 60 多个模型和流行数据集上进行了深入的实验，并释放了实用的评估工具包用于未来的基准测试。

Mar, 2022

通过微调平行语料库中的嵌入来进行单词对齐

该论文探讨了一种嫁接预训练语言模型和平行文本的方法来提高单词对齐质量的方法，提出了从这些微调模型中有效提取对齐信息的新方法，并证明了它们在五种语言对上优于之前的最先进模型，还演示了开源的具备预训练模型的 AWESOME 单词嵌入式多语言编码对齐器的实际性能

Jan, 2021

预训练词嵌入何时、为何对神经机器翻译有用？

本研究分析了预训练词向量在低资源场景下神经机器翻译性能提升方面的作用，通过五组实验结果表明，在某些情况下词向量的使用可以使翻译结果达到最高 20 个 BLEU 分数的提升。

Apr, 2018

神经网络机器翻译的两两评估

本文介绍一种利用神经网络在成对翻译评估中选出最佳翻译的新方法，该方法基于单词和句子嵌入形成紧凑的分布式向量表示，并利用多层神经网络对参考文本和两个翻译之间的交互进行建模，从而可以高效地学习和分类，且与人类评估结果的相关性不亚于当前技术水平的最高水平。

Dec, 2019

使用双向蕴涵的机器翻译评估

本文提出了一种基于双向蕴含的机器翻译评估新指标，利用深度学习实现候选和参考翻译之间的语义相似度评分，应用于 WMT'14 和 WMT'17 数据集，与传统指标相比在系统级别上具有更好的与人工注释评分的相关性。

Nov, 2019

NMT 衍生的语言中介嵌入的实证分析及其在平行语句识别中的应用

该研究系统研究了端到端的神经机器翻译的上下文向量作为句子的交互语言表征的功效，并在可比较语料库中取得了较高的平行句子识别准确率。

Apr, 2017

SimAlign：使用静态和上下文嵌入实现高质量的单词对齐，无需并行训练数据

本文提出了一种无需平行数据就能进行词对齐的方法，基于多语言词嵌入，可以用于统计和神经机器翻译以及跨语言注释投影等任务。结果表明，使用词嵌入创建的对齐效果比传统统计对齐器效果更好，即使是在有丰富的平行语料的情况下。

Apr, 2020

使用词相似性任务评估词嵌入存在的问题

使用词相似度任务作为词向量内在评估的代理，但没有标准化的词向量外部评估方法。本文探讨了使用词相似度数据集进行词向量评估时存在的问题，并总结已有的解决方案，最后指出这种方法不具可持续性，需要进一步研究词向量的评估方法。

May, 2016