多模态机器翻译及嵌入预测
本研究探讨了预训练词嵌入及其在多模式神经机器翻译模型中的应用,引入两种去偏差技术,并在英德翻译和英法翻译两种语言对上获得了最多 + 1.93 BLEU 和 + 2.02 METEOR 的性能提升。
May, 2019
Google 发布的 GNMT 神经机器翻译系统采用 LSTM 深度学习网络,使用 attention 机制和残差连接,借助词元素 (wordpieces) 将单词划分为子单元,提高了稀有单词处理能力与整体系统精度。
Sep, 2016
该研究探讨神经机器翻译模型所学到的嵌入,在需要同时考虑概念相似性和词汇 - 句法角色知识的任务中,它们的性能优于单语言模型所学到的嵌入。研究结果还表明,词汇扩展算法对嵌入质量的影响很小。
Dec, 2014
通过设计可解释的多模态翻译模型,我们发现多模态信息对于机器翻译的提升并不显著,相反是由于正则化效应带来的,这一发现强调了可解释性在未来研究中的重要性及其作用。
May, 2021
本研究分析了预训练词向量在低资源场景下神经机器翻译性能提升方面的作用,通过五组实验结果表明,在某些情况下词向量的使用可以使翻译结果达到最高 20 个 BLEU 分数的提升。
Apr, 2018
在低资源环境中,提出了一种用于模拟复杂形态的框架解决方案,该方案采用了双层 Transformer 架构来编码输入端的形态学信息。同时通过多标签多任务训练和基于 beam search 的解码器,提高了机器翻译性能,并使用通用形式的注意力增强方案来整合预训练语言模型和源语言和目标语言之间的词序关系建模。通过评估多种数据增强技术,提高了在低资源环境中的翻译性能,最终在基纳卢旺达语 - 英语翻译任务中取得了有竞争力的性能,希望我们的结果能够鼓励更多在低资源的神经机器翻译中使用明确的形态学信息以及所提出的模型和数据增强方法。
Apr, 2024
提出一种通过使用指针网络和强化学习来控制模型 - 专家交互的通用方法,从而解决当前系统中翻译罕见单词的主要挑战,并通过使用基于短语的模型来模拟专家来补充神经机器翻译模型,以改善英语 - 西班牙语和德语 - 英语之间的翻译质量。
Sep, 2018
本论文提出了一种新型的基于图的多模态融合编码器,用于多模态神经机器翻译(NMT)中利用不同模态语义单元之间的细粒度语义对应关系,以优化多模态表示学习,并在 Multi30K 数据集上验证了模型的卓越性能。
Jul, 2020
我们提出了一种新的判别模型,它从多语言和多模态数据中学习嵌入,因此我们的模型可以利用多种语言的图像和描述来提高嵌入质量。通过对图像和语句进行排名、对语义文本相似性进行评估,以及对神经机器翻译进行评估,我们发现附加的多语言信号可以改进 ISR 和 STS 任务,并且判别成本也可以用于重新排列 NMT 模型产生的最佳 $n$ 列表,从而产生强大的改进。
Feb, 2017