基于通用句子表示的自动机器翻译评估度量
本研究探讨了利用 Stanford 自然语言推断数据集的监督学习训练通用句子向量表示,相比于 SkipThought 等无监督方法,该方式在多种迁移学习任务中表现更优,因此表明自然语言推断适用于迁移学习。
May, 2017
SentEval 是一个用于评估通用句子表示质量的工具包,包括二元和多类分类、自然语言推理和句子相似性等任务,并提供用于下载和预处理数据集的脚本和易于使用的界面来评估句子编码器,旨在提供更公正、 less-burdensome 和更集中的评估句子表示的方法。
Mar, 2018
机器翻译中,自动评估指标在评分更长的翻译文本方面的有效性仍不清楚。本文提出了一种通过现有句子级数据创建段落级数据用于训练和元评估指标的方法,并利用这些新数据集对现有句子级指标进行基准测试,以及在段落级训练学习指标。有趣的是,我们的实验结果表明,使用句子级指标评分整个段落与使用专为段落级工作的指标同样有效。我们推测这一结果可能归因于基于参考的评估任务的特性以及数据集在捕捉段落级翻译中发生的各种现象方面的局限性。
Aug, 2023
本研究使用神经机器翻译框架跨越六种完全不同的语言,在学习联合句子表示方面。我们的目标是构建一种与语言无关的表示形式,有可能捕捉到基础的语义。我们定义了一种新的跨语言相似度衡量方式,对我们的模型学习出的 140 万个句子表示进行比较,并研究了相似句子的特征。实验证据表明,嵌入空间中相似的句子实际上具有高度的语义相关性,但通常具有不同的结构和语法。这种关系也适用于不同语言之间的比较。
Apr, 2017
本文介绍了一种针对数据有限的语言的新的通用机器翻译方法,利用迁移学习的方法,在多源语言之间共享词汇和句子级别的表示,从而帮助低资源的语言利用高资源语言的词汇和句子表示,在罗马尼亚语 - 英语 WMT2016 上,我们的方法在 6k 的平行语料库上能够获得 23 BLEU 分数,远高于使用多语言训练和反向翻译的强基线系统的 18 BLEU 分数,此外,我们还展示了该方法可以在零样本条件下对同一数据集进行微调,达到接近 20 BLEU 的分数。
Feb, 2018
本研究提出了一个通用的语言表示学习方法 MiSAD,通过利用大型未标记语料库中提取的有意义的 n-gram,实现对不同层次语言单位或具有相当不同长度的文本的嵌入形式,从而使手头的多个语言层次的信息能够更好地统一处理,并且在 GLUE 基准和问答数据集上显著提高了下游任务的性能以及在不同语言层次上实现了最高准确率。
May, 2021
本论文的研究目标是证明通用机器翻译算法的理论限制并提出更好的算法设计。研究发现在缺乏数据结构假设的情况下,任何算法都将在至少一个翻译任务上产生较大的翻译误差。此外,文档语料库采用编码器 - 解码器生成过程可用来实现 “泛化” 的自然概念,并且图像语言对之间的连接路径越长,需要的语言对数量也就越多。
Aug, 2020
本文提出了一种基于语义的机器翻译评估方法 HUME,利用 UCCA 语义表示计算句子的 semantics-based 值,而不需要对机器翻译输出进行语义标注。实验结果表明,HUME 在多个语言对上都有广泛的适用性,并与人类评估表现出良好的一致性。
Jun, 2016
提出了一种基于状态移动距离的多对多跨语言神经机器翻译模型,通过学习通用表示和跨映射关系,可以实现未经训练的语言对之间的零 - shot 翻译,实验证明该方法可以改善语义空间的对齐和预测的一致性。
Oct, 2022
该论文探索了使用源语言全局句子级特征来预测目标语言本地翻译,并提出了一种新的双语限制基于块的卷积神经网络来学习语义表示,并使用局部和全局信息的前馈神经网络来更好地预测翻译质量。实验表明,该方法可以在翻译质量方面得到实质性的提高。
Feb, 2015