基于词向量的词对齐段级机器翻译评估
该研究探讨神经机器翻译模型所学到的嵌入,在需要同时考虑概念相似性和词汇 - 句法角色知识的任务中,它们的性能优于单语言模型所学到的嵌入。研究结果还表明,词汇扩展算法对嵌入质量的影响很小。
Dec, 2014
使用神经网络在配对设置下进行机器翻译评估的框架,以从一对假设中选择更好的翻译为目标。该框架将参考和两个假设的词汇、句法和语义信息嵌入到紧凑的分布式向量表示中,并提供了一个与人类判断相关的 MT 评估度量。
Oct, 2017
该论文探讨了一种嫁接预训练语言模型和平行文本的方法来提高单词对齐质量的方法,提出了从这些微调模型中有效提取对齐信息的新方法,并证明了它们在五种语言对上优于之前的最先进模型,还演示了开源的具备预训练模型的 AWESOME 单词嵌入式多语言编码对齐器的实际性能
Jan, 2021
本研究分析了预训练词向量在低资源场景下神经机器翻译性能提升方面的作用,通过五组实验结果表明,在某些情况下词向量的使用可以使翻译结果达到最高 20 个 BLEU 分数的提升。
Apr, 2018
本文介绍一种利用神经网络在成对翻译评估中选出最佳翻译的新方法,该方法基于单词和句子嵌入形成紧凑的分布式向量表示,并利用多层神经网络对参考文本和两个翻译之间的交互进行建模,从而可以高效地学习和分类,且与人类评估结果的相关性不亚于当前技术水平的最高水平。
Dec, 2019
本文提出了一种基于双向蕴含的机器翻译评估新指标,利用深度学习实现候选和参考翻译之间的语义相似度评分,应用于 WMT'14 和 WMT'17 数据集,与传统指标相比在系统级别上具有更好的与人工注释评分的相关性。
Nov, 2019
该研究系统研究了端到端的神经机器翻译的上下文向量作为句子的交互语言表征的功效,并在可比较语料库中取得了较高的平行句子识别准确率。
Apr, 2017
本文提出了一种无需平行数据就能进行词对齐的方法,基于多语言词嵌入,可以用于统计和神经机器翻译以及跨语言注释投影等任务。结果表明,使用词嵌入创建的对齐效果比传统统计对齐器效果更好,即使是在有丰富的平行语料的情况下。
Apr, 2020
使用词相似度任务作为词向量内在评估的代理,但没有标准化的词向量外部评估方法。本文探讨了使用词相似度数据集进行词向量评估时存在的问题,并总结已有的解决方案,最后指出这种方法不具可持续性,需要进一步研究词向量的评估方法。
May, 2016